Do đó để bảo vệ quyền lợi, tải sản của cá nhân, tập thể hay công ty và hơn thể nữa là bảo vệ quốc gia, xã hội là một nhiệm vụ rất cẦn thiết, VÌ vậy đã xuất hiện nhiều kỹ thuật để xác mì
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO TRUONG DAI HOC SU’ PHAM KY THUAT
THÀNH PHÓ HÒ CHÍ MINH
HGMUIIE
ĐỎ ÁN TÓT NGHIỆP NGÀNH KỸ THUẬT ĐIỆN - ĐIỆN TỬ
NHẬN DẠNG KHUÔN MẶT NGƯỜI
TỪ CAMERA DÙNG ĐẶC TRƯNG HAAR - LIKE
KÉT HỢP VỚI GIẢI THUẬT CASCADE
CUA BOOSTED CLASSIFIER TREN OPENCV
GVHD: LE MY HA SVTH: BÙI ĐỨC VŨ
SKLOO
Trang 2
LỜI CAM ĐOAN
Em cam đoan đây là công trình nghiên cứu của Em
Các số liệu, kết quả nêu trong luận vân là trung thực và chưa từng được ai công
bố trong bất kỷ công trình nảo khác
tp He Chi Minh, nyay 17 thang 1 nam 2015
(Ký tên 9 øi rõ họ tên)
Trang 3LỜI CẢM ƠN
Em xin chân thành cảm ơn quý thầy cô trong bộ môn Điện Tử Công Nghiệp đã
trang bị cho Em kiến thức và giúp đỡ Em giải quyết những khó khăn trong quá trình làm đỗ án
Đặt biệt Em xin chân thành cảm ơn Thấy bướng dẫn, T.S Lê Mỹ Hà đã tận tình
giúp để trong quá trình lụa chọn đề tải và hồ trợ 3h trong quá trình thực hiện
Sinh viên
Bùi E
Trang 4TOM TAT
Bên cạnh những ưu điểm của sự bùng nỗ công nghệ thông tin vả sự phát triển của công nghệ cao thì không thể phủ nhận một điểu là những vấn đề của xã hội hiện đại xuất hiện theo chiều hưởng tăng cao và ngày cảng nguy hiểm như tội phạm công
nghệ cao, khủng bố, hackers, vv Do đó để bảo vệ quyền lợi, tải sản của cá nhân,
tập thể hay công ty và hơn thể nữa là bảo vệ quốc gia, xã hội là một nhiệm vụ rất cẦn thiết, VÌ vậy đã xuất hiện nhiều kỹ thuật để xác mình, xác định một người trong,
an mình, bảo mat hay gián sát Trong số đó, có thé nói đến hệ thing nhận dạng mặt người bảng hìuh ảnh Nhân dạng mật người là xử lý một ảnh hay i2 42nz video để xúc định danh tình tự động cho từng người dựa vào nội dung của 2y:
Nhận dang mat người được ứng dụng trong thực tế như kiểm soát truy cáp cho tòa nhà, sản bay, cảng biển, các trạm kiểm soát biên giới, giám xác tội pham ma túy, tội phạm khủng, bố, camera chống trộm, máy ATM, hệ thống chấm
gìử xe siêu thị, vy Tuy nhiên, Các ứng dụng nhận dạng khuôn mát vượt xa giới hạn cho hệ thông an ninh Tự động nhận dạng khuôn mặt có thê được sử đụng trong
rất nhiều lĩnh vực khác ngoài hướng đi ứng dụng bảo mật (kiểm soát truy cập / hệ thống kiểm tra, giám sát hệ thống), chằng hạn như máy tính giải trí và tùy chỉnh
tương tác máy tính - con người Các ứng dụng tùy chỉnh tương tác máy tính - con người trong tương lai gần sẽ được tìm thấy trong các sản phẩm như xe hơi, hỗ trợ
cho người tàn tật, vv
Trong Đồ Án Tốt Nghiệp này của em chủ yếu tập trung vào phần cứng nhận
đạng khuôn mặt người trong điều kiện ánh sáng ổn định và khuôn mặt không quá nghiêng Dùng một camera để thu nhận ảnh, đữ liệu thu được sẽ được chuyển vào máy tính Sau đó, trên máy tính sẽ chạy chương trình nhận đạng khuôn mặt người dùng dữ liệu được thu nhận từ camera đó Ở đây, dùng đặc trưng Haar-like để trích xuất những cấu trúc cục bộ mà tương đồng với những cấu trúc như trong mặt người,
dùng AdaBoost để chọn những đặc trưng tối ưu nhất để tách khuôn mặt và không,
iii
Trang 5phải khuôn mặt, dùng thác phân loại (Cascade of Classifiers) để phát hiện hoặc
nhận dạng một cách nhanh chóng và chính xác, đáp ứng được các ứng dụng thời
gian thực Các kết quả nghiên cứu trước đây cho kết quả rất khả quan, độ chính xác
cao
Trang 6ABSTRACT
Nowadays, the more information technology has developed rapidly and strongly with their advantage, the more complicated the modern society has.High-technology
crime, terrorist, hackers, ect have increased and dangerous Therefore, finding the
ways to protect things of personal eflect, group, company and national are the very important Wike, Ag a fesnlt, a let of technology to verily sormeone in security or
superviaon, Anony there aolitns, recognizing face by mage i 44 mentioned Recognising fice te the inage or video processing to define someone's identity up
fo content af nape antatcally,
Recopniving fice is applied on access controlling of building
(rentice mspection post, drug criminal, terrorist, camera
he machine,
computer and interaction between computer — human that can be applic
supported invalid in a near future
In this thesis, we were mainly focused on facial recognition hardware with stable
light condition and the faces are not too inclined Using a camera for image acquisition, data collected will be transferred to the computer Then the computer
will run the face recognition application using data obtained from this camera Here,
Haar-like features are used to extract the local structure that resembles the structures
on human faces Then, AdaBoost algorithm is utilized for selecting the optimal
features to separate the face and not the face objects The Cascade of Classifiers can
detect or identify the objects quickly and accurately, to meet the real-time
applications The experiments pointed out that this method gives promising result with high precision
Trang 7MỤC LỤC
LỜI CAM ĐOAN 6S cc
1.1.1 Lich Sử Phát Triển Của Nhận Dạng Khuôn Mặt Người
1.1.2 Một Vài Nghiên Cứu Nhận Dạng Khuôn Mặt Trước Đây
Trang 82.1 Các Loại Đặc Trưng Thường Dùng Để Nhận Dạng Khuôn Mặt Người 12
3.1.2 Camera Honeywell HCD484EX
3⁄2 Giao Tiếp Giữa Camera Với Máy Tính
Trang 94.2 Các Phương Pháp Nhận Dạng Khuôn Mặt Trong OpenCV
4.3 Nhận Dạng Khuôn Mặt Từ Camera Trong OpenCV Dùng Fisherfaces
43.1 Sơ Đồ Thuật Toán
4.3.2 Tạo Một Tập Dữ Liệu Khuôn Mat Cita Người Cần Nhận Dạng Và Một File CSV.ext
Hình 1.1: So sánh khả năng tương thích sáu kỹ thuật sinh trắc học (mặt, ngón tay,
bản tay, giọng nói, mắt, chữ ký) với máy tính có thể đọc được giấy tờ đi lại
Trang 10Hình 1.2: Bốn bước chung trong nhận dạng khuơn mặt
Hình 2.4: Ví dụ cách tinh nhanh các giá trị mức xám cửa vũng D trên ảnh 4
Hình 3,4; Minh họa về ảnh tích chấp và cách tỉnh giá trị mức xá¡n Kesevrsusrxoll Bố)
Hình 36 Đúng đặc túng Liaat-hÉe để trích các đặc trưng khuơ wld
Hinh 3: Dũng đặc trưng Nậi- like trong phát hiện và nhận điện ki
Hình 28 Hình đang của 40 bộ lọc Gabor[3]
Hình 29: (a) Phần thực của hạt nhân Gabor tai nam quy mơ và tám
ân kaay C3, và F= 212 (b) độ lớn của hạt nhin Gabor tai nam #
Hình 3.2: Dell Vostro 5560 V5560A
Hình 3.3: Camera Honeywell HCD484EX
Hình 4.1: Sơ đồ cấu trúc của OpenCV
Hình 4.2: Local Binary Patterns hay ma LBP
Trang 11Hình 4.3: Sơ đồ thuật toán nhận đạng khuôn mặt người dùng Fisherface
Hình 5.1: Kết Quả Thực Nghiệm
Trang 12Chương 1
TỎNG QUAN
1.1 Tổng Quan Về Nhận Dạng Khuôn Mặt Người
Nhận dạng khuôn mặt người là một trong những ứng dụng quan trọng của thị
giác máy tính (Computer Vision) nói riếng cũng như khoa học máy tính nói chung
Mặc dù nghiên cửu về nhận dạng khuôn mat ty dong đã được thực hiện từ những
nim 1960 nlm nó mới phát triển mạnh mệ trong hơn 16 nam trở lại đây bởi cộng
đồng khoa hạc, Nhiễn kệ thuật phần tích khuôn mật và kỹ thuật mó bính hóa đã tiến
bộ đáng kể Tuy nhiên, để chính xác của các hệ thống nhận đạng kz¿ôn mát trong
các điều kiện khác nhau vẫn còn là một thách thức đối với cộng bọc
Thời
man gan diy, nhận dạng khuôn mặt không những nhận được sự chú ý cộng
đồng Khoa học mà còn nhận được sự quan tâm của công ching Sự ở
công chúng nói chung chủ yếu là do tìm năng ứng dụng của nhận
mang lại, ví dụ tương tác giữa người và máy, video giám sát, vv
những vấn đề của xã hội hiện đại như sự giả mạo chứng minh nhân dán, sự xâm
nhập vật lý và lỗ hỏng của các mật khẩu alphanumerical ngày càng xuất hiện
thường xuyên trong các phương tiện truyền thông nên cần có cơ chế kiêm soát được chấp nhận rộng rãi cho việc xác định và kiểm tra cá nhân mà đem lại sự tin
cậy và thân thiện
Kỹ thuật dựa trên sinh trắc học đã nổi lên như là phương pháp nhận dạng cá nhân đầy hứa hẹn và đang dần thay thế cho các phương pháp tiếp cận truyền thống
(chẳng hạn như mật khẩu, mã PIN, các loại thẻ, chìa khóa, vv ) Sinh trắc học dựa
trên sự xác thực về các khía cạnh đặc điểm nội tại của một con người cụ thể như khuôn mặt, dấu vân tay, hình dáng ngón tay, hình bàn tay, tĩnh mạch tay, lòng bàn
tay, mống mắt, võng mạc, tai và giọng nói, nó không bị lãng quên, đánh cắp hay giả
mao như các phương pháp truyền thống.Trong số các kỹ thuật sinh trắc học lâu đời
Trang 13nhất là nhận đạng vân tay Kỹ thuật này đã được sử dụng ở Trung Quốc để xác nhận
sự chính thức của hợp đồng Sau đó, vào giữa thế kỷ 19, sf được sử dụng để xác định người ở châu Âu Một kỹ thuật sinh trắc học hiện tại đang phát triển là nhận
dang méng mat hay còn gọi là tròng den(iris) KY thuat nay hién nay được sử đụng
thay thế xác định hộ chiếu cho người đi thường xuyên ở một số sân bay trong
United KingDom , Canada và Netherlands Cũng như kiểm soát truy cập của người lao động tại các khu vực cấm như sản bay cua Canada va tai san bay New Yorks
JFK Những kỹ thuật này là bất tiện do cần có sự tương tác với những người được xác định và chúng thực, Nhân đang khuôn miật nắm giữ nhiều lợi thế hơn các kỹ
thuật ginh trắc học khác, đó là tự nhiên, không xâm nhập và dễ sử dụng, điều này
đặc biệt có lợi cha các mục địch an nình và giám sát, Đây là một trong những lý do tại sao kỹ thuật này đã tui bit sự quan tam tang dần từ cộng đông kbz4 học trong 1Ú nầm gần đáy Trong miột nghiên cứu xem xét các khả nắng tươyg tôích sáu kỹ thuật sinh trắc học (mật, ngón tay, bàn tay, giọng nói, mắt, chữ ký) với tính có thể đọc được giấy tdi lai (Machine Readable Travel Documents - M2 TD) {1} Đặc
điểm Khuôn mặt chiếm tỷ lệ phần trăm khả năng tương thích cao nhét, xem hinh
1,1, Trong nghiên cứu này các thông số như tuyển sinh( kết nạp), đổi mới yêu cầu máy tính và nhận thức của công chúng được xem xét Tuy nhién, đặc điểm khuôn mặt không nên được coi là sinh trắc học đáng tin cậy nhất Các ứng dụng nhận dang khuôn mặt đang ở xa giới hạn cho hệ thống an ninh Tự động nhận dạng khuôn mặt
có thể được sử dụng trong rất nhiều lĩnh vực khác ngoài hướng đi ứng dụng bảo mật (kiểm soát truy cập / hệ thông kiểm tra, giám sát hệ thống), chẳng hạn như máy tính -giải trí và tùy chỉnh tương tác máy tính - con người Các ứng dụng tùy chỉnh tương tác máy tính - con người trong tương lai gần sẽ được tìm thấy trong các sản phẩm
như xe hơi, hỗ trợ cho người tàn tật, các tòa nhà, vv
Trang 14Face Ginger Hand Voice tực #g/xature |
Hinb 1.1: So sdnt kha nang tueng thich sáu kỹ thuật sinh trắc hợc (mát, ngớn tay,
bản tay, giọng nói, mắt, chữ ký) với máy tính có thể đọc được giáy tớ đi lại
(MRTD) [1]
Do sự phát triển của công nghệ chẳng hạn như siêu máy tính , kít nhúng có tốc
độ xử lỷ cao, máy ảnh kỹ thuật số, internet, vv và do một nhu cầu lớn hơn cho các
chương trình bảo mật khác nhau mà số lượng của các ứng dụng nhận dạng khuôn
mặt tự động sẽ tăng nhiều hơn trong tương lai Mac di con người là chuyên gia
trong nhận dạng khuôn mặt nhưng chưa hiểu rõ được làm thế nào để nhận dạng
chính xác được trong mọi hoàn cảnh khác nhau của đối tương Trong nhiều năm psychophysicists và nhà thần kinh học đã được nghiên cứu xem nhận dạng khuôn
mặt được thực hiện một cách toàn diện hoặc bằng cách phân tích các đặc điểm cục
bộ, tức là nhận dạng khuôn mặt được thực hiện bằng cách nhìn vào khuôn mặt như
một toàn bộ hoặc bằng cách nhìn vào đặc điểm khuôn mặt của cục bộ một cách độc lập
1.1.1 Lịch Sử Phát Triển Của Nhận Dạng Khuôn Mặt Người
Cách trực quan nhất để thực hiện nhận dạng khuôn mặt là nhìn vào các đặc trưng chính của khuôn mặt và so sánh các đặc trưng này với các đặc trưng tương tự khác
Trang 15trên khuôn mặt Một số các nghiên cứu sớm nhất về nhận đạng khuôn mặt được
thực hiện bởi Darwin và Galton Công việc của Darwif bao gồm phân tích các biểu
hiện khác nhau trên khuôn mặt do trạng thái cảm xúc khác nhau, trong khi đó
Galton nghiên cứu các mặt nghiêng của khuôn mặt Tuy nhiên, cố gắng đầu tiên để
phát triển hệ thống nhận dạng khuôn mặt bán tự động bắt đầu vào những năm cuối thập niên 1960 và đầu những năm 1970, và được dựa trên thông tin hình học Ở
đây, điểm mốc được đặt trên các bức ảnh định vị các đặc điểm lớn của khuôn mặt,
chẳng hạn như mãt, tai, môi, và góc miệng, Khoảng cách tương đối và góc được
tính từ những điểm móc này đến một điểm tham chiếu chúng và so sánh với dữ liệu
tham kháo(referenee data)
ém mộc chủ Gollsteii và các công sự (1971) tạo ra được một hệ thống của Z1
quan, chàng hạn nhữ tan tác và độ dày môi Những, điểm móc dug
rất khỏ để tụ đồng hóa do tính chất chủ quan của nhiều người troz
vẫn lầm hoàn toàn bằng lay,
an phù hợp hơn để làm nhận dạng khuôn mặt đã được thực hiện
Một cách tiệp
bởi Fischler và các cộng sự (1973) và sau đó là Yuille và các cệ
Phương pháp này đo đặc điểm khuôn mặt bằng cách sử dụng mẫu của cá
không đôi trên khuôn mặt và ánh xạ các đặc trưng này lên mau chung( global)
Tom lại, hẳu hết các kỹ thuật phát triển trong giai doan dau tién cua nhan dang
khuôn mặt tập trung vào tự động phát hiện các đặc trưng của khuôn mặt cá nhân
Ưu điểm lớn nhất của phương pháp này dựa trên đặc trưng hình học, các đặc trưng này là không nhạy với ánh sáng và sự hiểu biết trực giác của con người về trích xuất đặc trưng Tuy nhiên cho đến ngày nay việc phát hiện đặc trưng khuôn mặt và kỹ thuật đo lường là không đủ tin cậy cho việc công nhận đặc trưng dựa trên hình học của một khuôn mặt và một mình tính chất hình học là không đủ để nhận dạng khuôn
Do những hạn chế của nhận dạng khuôn mặt dựa trên đặc trưng hình học nên kỹ
thuật này đần đần bị loại bỏ và một kỹ thuật đựa trên màu sắc tổng thể đã được thực
Trang 16màu sắc tổng thể sắp xếp một tập các gương mặt khác nhau để có được một sự
tương ứng giữa các cường độ điểm ảnh, một phân loại vùng lân cận nhất có thể
dùng để'phân loại các gương mặt mới khi nó xuất hiện lần đầu tiên trên ảnh, đó là
kỹ thuật Eigenfaces - một phương pháp học tập thống kê Thay vì so sánh trực tiếp
các cường độ điểm ảnh của những hình ảnh trên khuôn mặt khác nhau, kích thướt
của các cường độ đầu vào lần đầu tiên đã được giảm bằng một phân tích thành phần
chính (PCA) trong kỹ thuật Eigentace Eigenfaccs lä một thành phần cơ sở của rất
gương mặt cả nhần rang Fshetfaces, kích thước của các cường ổi ctor đâu vào
được PCA lầm giảm và sau đó FLDA được áp dung dé có được mm
ưu để phần tách các khuôn mặt từ những người khác nhau
Sou sy phát trên của kỹ thuật Fisherface, nhiều kỹ thuật liên quan đã được để
1.1.2 Một Vài Nghiên Cứu Nhận Dạng Khuôn Mặt Trước Đây
DangBao, phát hiện và nhận dạng khuôn mặt dùng kỹ thuật fisherfaces trên
OpenCV, ngày 17 tháng 9 năm 2013
Dr Domenico Daniele Bloisi, phát hiện khuôn mặt đùng thác phân loại , ngày 1 tháng 7 năm 2014
Faten Bellakhdhar, Kais Loukil and Mohamed ABID, nhận dạng khuôn mặt ding Gabor Wavelets, PCA va SVM”, thang 3 nam 2013.
Trang 17Sharif, Sajjad Mohsin, Muhammad Younas Javed, và Muhammad Atif Ali kết
hợp thuật toán Laplacian of Gaussian (LoG) và DCT năm 2012
Suhas, Kurhe Ajay B., va Dr Prakash Khanale B áp đụng PCA kết hợp với DCT
theo hướng tiếp cận toàn diện năm 2012
Sunil nhận đạng khuôn mặt dùng PCA kết hợp voi DCT năm 2013
Trịnh Tấn Đạt, Phạm Thế áo, nhận dạng mặt người dùng đặc trưng GABOR
kết hợp ADABOOST và K-MEA", năm 2013
Bonzalmal, Jamal Khartoubi và Arnalane Z2iphili nhân dạng khuôn mặt người
trên ảnh áp dụng thuật toán máy học SVM dụa tiên LOA nấm 2013
Gan day hidnp tiép can diva wen cde đặc trưng cục bộ khóng đối SIFT của
Lowe (2004) shige quan tam nhiều Đặc trưng cục bộ SIFT không f ay đôi trước
những biển đốt tý Íe ảnh, tình tiện, phép quay, không bị thay đối ø
phép biển đòi hình học atine (thay đổi góc nhìn) và mạnh với r đối về độ
súng, sự nhiều và che khuất, Aiy (2006) sử dụng các đặc trưng SIFT dạng
mặt người, Chennanama, Lalitha Rangarajan, và Veerabhadrapp: áp dụng
thuật toán so khớp SIFT để nhận dạng khuôn mặt trên tập anh đã lọc
trước, đồng thời so sánh kết quả nhận dang voi thnat toan phan tich thanh phan
chinh Shinfeng, Jia-Hong Lin, va Cheng-Chin Chiang (2011) kết hợp phương pháp
phân tích thành phần chính và đặc trưng SIFT để nhận dạng khuôn mặt người
Kumar và Padmavati (2012) đã đề xuất các cách tính khoảng cách khác nhau khi so
khớp các đặc trưng SIFT để nhận đạng mặt người, góp phần cải thiện tốc độ so khớp các đặc trưng SIFT [2]
Kết luận : Các phương pháp hiện tại cho nhận điện khuôn mặt có thể được chia
thành hai phương pháp chính: phương pháp dựa trên tổng thể hình ảnh và phương
pháp dựa trên các đặt trưng hình học Do những hạn chế đã nêu trên nên phương
pháp nhận dạng dựa trên các đặt trưng hình học ít được sử dụng mà chủ yếu sử
dụng phương pháp dựa trên tổng thể hình ảnh để nhận dạng khuôn mặt Phương
Trang 18Discriminant Analysis - LDA), phân tích thảnh phần độc lập (Independent
Component Analysis — ICA), máy hỗ trợ vector (Support Vector Machines — SVM),
mang Neural, Adaboost Using Haar Classifiers, vv
Hệ thống nhận dạng khuôn mặt thường bao gồm bốn bước, được thể hiện trong hình 1.2, phát hiện khuôn mặt (định vị trí, tiền xử lý khuôn mặt, khai thác các đặc trưng và so khớp các đặc trưng
"Vũng ảnh con chứa khuôn mật
Ảnh hose
Hình 1.2: Bốn bước chung trong nhận đạng khuôn mặt
Ba nhiệm vụ chính trong nhận dạng khuôn mặt thường dùng là:
e Xác mình (xác thực): Nhiệm vụ xác minh là nhằm mục đích ứng dụng yêu cầu tương tác người dùng trong một hình thức tuyên bó danh tính, tức là các
ứng dụng truy cập
e_ Xác định (công nhận): Nhiệm vụ xác định chủ yếu là nhằm vào các ứng dụng không yêu cầu tương tác người dùng, nghĩa là ứng dựng giám sát
© Danh sách theo đõi: Nhiệm vụ danh sách theo dõi là một sự tổng quát của
nhiệm vụ xác định bao gồm những người chưa biết và đã biết danh tính
Có 3 vấn đề cần cân nhắc trong quá trình nhận dạng khuôn mặt đó là:
©_ Các biến thể khuôn mặt của các cá nhân khác nhau có thể là rất nhỏ và một
cá nhân lại có thể xuất hiện nhiều biến thể khuôn mặt khác nhau do tư thế,
Trang 19điều kiện ánh sáng, cảm xúc của khuôn mặt, chất lượng của thiết bị thu nhận anh, wv
e Sự đa dạng phi tuyến tính xuất hiện trên hình ảnh khuôn mặt tức là xuất hiện những mẫu không phải là khuôn mặt người nhưng lại hiểu sai nó là khuôn
mặt người
© Không gian đầu vào đa chiều (high-dimensional input space) và chỉ có một
số lượng nhỏ hình mẫu của một cá nhân do đó xuất hiện vấn đề là khó mà có
thể thực hiện xấp xỉ một ảnh cá nhân trong không gian đa chiều đó
Không gian khuôn mặt
Hình 1.3: Minh họa vấn đề không gian đầu vào đa chiều va chỉ có một số lượng
nhỏ hình mẫu của một cá nhân Các mẫu được đánh dấu bằng vòng tròn màu đỏ
1.13 Định Hướng
Các phương pháp dựa trên Eigenfaces, phân tích thành phần chính (Principal
Component Analysis - PCA), phân tích tuyến tính tách biệt (Linear Discriminant
Analysis - LDA), phân tích thành phần độc lập (ndependent Component
Trang 20Analysis — ICA), máy hỗ trợ vector (Support Vector Machines — SVM), mạng
Neural, vv Hầu hết các thuật toán sử dụng giá trị điểm ảnh thô như các đặc trưng
và rất nhạy cảm với tiếng ồn và sự thay đổi trong chiếu sáng Thay vào đó, các đặc
trưng Haar-like mã hóa khác biệt trung bình cường độ giữa hai khu vực hình chữ
nhật, và họ có thể trích xuất kết cấu không phụ thuộc vào cường độ tuyệt đối
Đặc trưng Haar-like trích xuất được những cấu trúc cục bộ mà tương đồng với
những cấu trúc như trong mặt người, các đặc trưng Haar-like tính toán rất nhanh, ít
bị ảnh hương bởi tiếng ồn, sự thay đổi của ánh sáng vá hiện suất phát hiện cao nên
được dùng đề phát hiện và nhận đang khuôn mit người
Adnlionat còn được pụt là phương pháp máy học tăng cường, nó hoạt đóng trên
nguyên tắc kết lay uyên tính các phan loai yéu (weak classifiers) 4é 5 thành
một phần hoat mạnh (suong classifier) Né lam giảm đáng kể những mẫu không
phải là Khuôn mặt một cách nhanh chóng
Số lượng đặc trưng trên một mẫu là khá lớn, ví dụ ảnh có kích t2
sắp xì 160.000 đặc trưng [3] nhưng không phải mẫu nào cũng k5ó
nhận dạng có những mẫu chỉ cần một đặt trưng hoặc một vải đặc trưng i¿ phát hiện hoặc nhận được rồi vì vậy sử dụng thác phân loại (Cascade of Classifiers) dé phat hiện hoặc nhận dạng một cách nhanh chóng và chính xác, đáp ứng được các ửng dụng thời gian thực
Vì những lý do trên, Trong, Đề Án này Nhóm em sử dụng đặc trưng Haar-like
kết hợp với thuật toán AdaBoost trên mô hinh Cascade of Classifiers để nhận đạng khuôn mặt người từ camera trên nền tảng OpenCV
1⁄2 Mục Đích Của Đề Tài
Xây dựng được hệ thống phát hiện và nhận dạng khuôn mặt người trên 90% từ
camera dùng đặc trưng Haar-like kết hợp với giải thuật Cascade của Booted Classifiers trên OpenCV
Trang 21143 Giới Hạn Đề Tài
s - Nhận dạng được khuôn mặt từ 90% trở lên
» Điều kiện ánh sáng ổn định, không quá sáng hoặc quá tối, khoảng cách từ
0.35m đến 1.5m
s - Khuôn mặt không quá nghiêng
1.4 Phương Pháp Nghiên Cứu
® - Phát hiện khuôn mặt:
Dùng mội khung cửa sé thay đói kích thướt, quét trên toàn bộ bình ảnh thu nhận
được tir camera Véi indi khing cửa số tà dùng đặc trưng Ífaar-like đề trích xuất
những cấu trúc cục hộ mã nang động với những cấu trúc nhu tre
Khuôn mặt guốt Vì số lượng đặc trưng trong một khung củ:
thuật toán Adaboost để chọn những đặc trưng tối ưu nhất đề tách k5zé
nền Để đáp ứng được thời gian thực, dùng thác phân loai (Cascade OF
để loại bỏ nhanh những của số không phải là khuôn mặt người
® - Nhận dạng khuôn mặt người:
Với khuôn mặt được phát hiện ở trên, ta so sánh với một tập dữ liệu khuôn mặt
của người cần nhận dang và một file CSV.ext để gán tên của người được nhận dạng Một trong những kỹ thuật nhận dạng hiện nay nữa là Fisherfaces, kỹ thuật này
được sử dụng rộng rãi và được đề cập nhiều Nó kết hợp các Eigenfaces với Fisher
Linear Diseriminant Analysis (FLDA), để có được một phân tách tốt hơn trong
những gương mặt cá nhân Trong Fisherfaces, kích thước của các cường độ vector
đầu vào được PCA làm giảm và sau đó FLDA được áp dụng để có được một phép
chiếu tối ưu để phân tách các khuôn mặt từ những người khác nhau
Trang 2215 Tóm Tắt Đề Tài
Như vậy, với các yêu cầu về nhiệm vụ và Thục tiêu đê ra, luận văn được xây
dựng bao gồm các chương sau:
- Chương 1: Téng Quan Chương này trình bày khái quát về nhận đạng khuôn
mặt người, tầm quan trọng lịch sử phát triển và định hướng đề tài
- Chương 2: Cơ Sở Lý Thuyết Trong Nhận Dạng Mặt Người Chương này trình bảy cơ sở lý thuyết về nhận dạng, khuôn mặt
- Chương 3; Cấu Trúc Phần Cứng Chương nây trình bày về hệ thống phần cứng cần thiết cho: nhận đang khuôn mật người
Chương 4: Nhận Dạng Khuôn Mật Trong OpenCV, Chương này trình bày
một số nhường phát nhận dạng trên OpenCV
- Chương %' kết Qua Thực Nghiệm Và Đánh Giá Chương này trính bay cdc Kết qua dat được
+ Chương 6: Kết Luận Và Hướng Phát Triển
11
Trang 23Hình 2.1: Bến đặt trưng Haar-like cơ bản
Để sử dụng các đặt trưng này vào việc xác định khuôn mặt người, 4 đặt trưng,
Haar-like cơ bản được mở rộng ra bằng cách xoay 45° và 90° và được chia làm 3 tập
đặc trưng như sau:
= Pic trung canh (edge features):
IIm
» _ Đặc trưng đường (line feature§):
Sor
Trang 24= Dac trung trong tâm đường biên (center-surround features):
Hình 2.2: Các đặc trưng mở rộng của các đặc trưng Haar-]ike cơ sở
Dùng các đặc trưng trên, tạ có thể tính được giá trị của đặc trưng Haar-like là sự
chênh lệch giữa tổng giá trị của các pixel của các vũng den và các vùng trắng như
trong công thức snu:
fx) Lyi mịnn¿¡ ĐH trắng - Đau trịpixet tùng đen (2.1)
một khái niệm gọi là ảnh tích hợp (Integral Image), là một mảng 2 chiều với kích
thước bằng với kích của ảnh cần tính các đặc trưng Haar-like, với mỗi phản tử của mảng này được tính bằng cách tính tổng của điểm ảnh phía trên dòng trừ 1 và bên
trái cột trừ 1 của nó Bắt đầu từ vị trí trên bên trái đến vị trí đưới phải của ảnh, việc
tính toán này đơn thuần chỉ đựa trên phép cộng số nguyên đơn giản, do đó tốc độ thực hiện rất nhanh
13
Trang 25Sau khi đã tính được ảnh tích hợp, việc tính tông các giá trị mức xám của một
vùng bắt kỳ nào đủ trên ảnh thực hiện rất đơn giản
Vi dul: Gia sir ta cần tính tổng các giá trị mức xám của vùng D như trơng hình
2⁄4, ta có thể tính như sau:
D= (4,4) ~ (%2,¥2) — (s.ys) + (yi) = (A +B + C + D)— (A+B) ~ (A+C) £ A
Với A +B+C +D chính là giá trị tại diém P, trên Integral Image, tương tự A+B
là giá trị tại điểm P;, A+C là giá tri tại diém Py, và A là giá trị tại điểm Pạ
Hình 2.4: Ví dụ cách tính nhanh các giá trị mức xám của vùng D trên ảnh
Trang 26Anbgoe Ảnhtíchchập Ảnhgốc Ảnh tích chập
1J5|2 |5 9 |23|31144 1[5 | 2[5 9 |23|31|44
2+3+1+4+2+2=14 23-6-8+2=11 a) Ảnh tích chập b) Tính giá trị mức
xám từ ảnh tích chập
Hình 2.5: Minh họa về ảnh tích chập và cách tính giá trị mức xám
Nhận điện khuân mặt đàng đặc ưng Haar-like được thực hiện báng cách quét
một khung Ánh tại các quy mồ khác nhau trên ảnh và tìm kiếm một số mô hình đơn
giản mà xác định sự hiện diện của một khuôn mặt
Đặc trưng Haar-like có giá trị vô hướng đại diện cho sự khác biệt ở cường độ
trung bình giữa hai khu vực hình chữ nhật Các đặc trưng Haar-like nắm bắt cường
Trang 27độ radient tại các địa điểm khác nhau: không gian, tần số và hướng bằng cách thay
đổi vị rí, kích thước, hình dáng và bố trí của các khu vực bình chữ nhật triệt để dựa
theo độ phân giải của máy đò do đó có thể phát hiện và nhận điện được khuôn mặt ở
Các Gabor wavelet thường được gọi là bộ lọc Gabor trong phạm vi các ứng
dụng Đặc trưng Gabor wavelet trích xuất các đặc trưng cục bộ của đối tượng mà
ta cần, chuẩn hóa và tối ru các đặc trưng đó trong miễn không gian (thời gian) và miền tần số tương tự như hệ thống thị giác của con ngươi và kích thước hạt nhân
của nó có thể được điều chỉnh cho phép nó dễ dàng thực hiện phân tích đa phân
giải Gabor wavelet trích xuất các đặc trưng trực tiếp từ những hình ảnh màu xám
Các đặc trưng Gabor wavelet nhận dạng khuôn mặt khá tốt, không những phát hiện
Trang 28được khuôn mặt ở điều kiện độ sáng hay cảm xúc của khuôn mặt Các Gabor wavelet W,,„ được xác định như công thức sau:
Các Hìam số „ và v lần lượt là hướng và quy mô cua nhân Ciabor
Ø là độ lệch chuẩn của phản phối Gauss, |[.|| là toán từ chuấn
hua® be
` là một veclơ sóng
Ác Ko, °Ê” là tần số của sóng,
tọy— A|L§ là hướng của song
kua là tần số tối đa của song,
£` là hệ số khoảng cách giữa các nhân trong miễn tấn số
Số lượng Gabor wavelets được sử dụng thay đổi phụ thuộc vào các ứng dụng khác nhau, nhưng thường là 40 bộ lọc Sử dụng 8 hướng và 5 quy mô khác nhau để tạo ra 40 bộ lọc Gabor, cụ thể p € {0, ,7} và v e {0, ,4} Các thông số khác
thường được chọn như sau: Ø = 271; Kmạx = 1/2; ƒ= V2 Gọi I{z) là giá trị mức
xám tại điểm ảnh z, tích chập của I(z) với một bộ lọc Gabor ÝŸ,,,„ được xác định như công thức sau:
Ops=1@* Pay (2.5)
Một đặc trưng Gabor wavelet j được cầu hình bởi ba thông số quan trọng:
vị trí z, hướng ¡ và độ lớn v,được định nghĩa là:
Trang 29Giá trị || ©u„„ || chính một đặc trưng Gabor tại vị trí z với hướng và quy mơ là p
và v Một vectơ đặc trưng Gabor đại diện cho tồn bộ bức ảnh I cĩ được Bằng cách ghép nổi theo dang tat cả các giá trị | ©ụx ||, Ðz € I, v € {0, ,4},u €{0, ,7}
Ta gọi G() là vectơ đặc trưng Gabor của ảnh I: G) = (|| oà | |Ì 00,1 [ll O07 Ill] 04,0 Ih Il ©4,7[)-
Hinh 2.8: Hình đáng của 40 bộ lọc Gabor [4]
Trang 30
Hình 2.9: (a) Phần thực của hạt nhân Gabor tại năm quy mô và tám định hưởng
6 = 2m, Kix = 7/2, va f= 21/2 (b) dé lớn của hạt nhân Gabor tại nam giá trị
khác nhau [4]
Trang 312.2 Cơ Sở Dữ Liệu Khuôn Mặt Người ( EACE DATABASE)
Có rất nhiều cơ sở dữ liệu khuôn mặt, sau đây là một số dữ liệu thông dụng
Có 3 cơ sở dữ liệu thường được dùng là:
e IMM Frontal Face Database: Duge sử dụng cho thử nghiệm ban đầu
Trang 32«The AR database: Được sử dung cho một bài kiểm tra toàn diện của phương
pháp nhận dạng khuôn mặt MIDM (Multiple Individual Discriminative
Models)
© The XM2VTS database: Được sử dụng để đánh giá hiệu quả hoạt động của
Thuật toán MIDM
2.2.1 AR — Database
Cơ sở dữ liệu AR được ghi nhận vào năm 199% tai Trung tâm thị giác máy tính
(Computer Vision Center) frong Barcelona Cơ sa dit liga chứa các hình ảnh của
116 người, 7Ô ham và Ấ6 nữ, Mỗi người da được ghi lại tong hai lần (sessions),
mỗi lin bao goin 14 hink anh, ket qua co téng s6 3016 bink ank fai lan duce ghi lại hai tuần ngoài TẢ hình ảnh của mỗi lần chụp có nét mặt, ánh ác nhau
768 x Ã76 paxel Cát mộc chú thích dựa trên 22 điểm mốc chương
một số hình ảnh cua cơ sở dữ liệu AR
Cơ sở dừ liệu BiolD được ghi nhận vào năm 2001 BioID chứa 1521 binh ảnh của
23 người, khoảng 66 hình ảnh mỗi người Cơ sở dữ liệu được ghi lại trong một
số lượng không xác định các lần sử dụng một biến thể chiếu sang cao, biểu hiện
khuôn mặt và nền Mức độ biến đổi không được kiểm soát kết quả trong sự xuất
hiện hình ảnh cuộc sống "thực" Tắt cả hình ảnh của cơ sở đữ liệu BioID được ghi
lại trong màu xám với độ phân giải 384 x 286 pixel Điểm mốc chú thích dựa trên
20 điểm mốc chương trình có sẵn
2.2.3 BANCA
Đa cơ sở dữ liệu Banca được thu thập như một phần của dự án Banca châu Âu
Banca chứa các mẫu hình ảnh, mẫu video và các mẫu âm thanh Banca chứa các
hình ảnh của 52 người mỗi người được ghỉ nhận trong 12 lần mỗi bao gồm 10 hình
21
Trang 33ảnh, kết quả là có tổng số 6240 hình ảnh Các lần được ghỉ nhận trong thời gian ba
tháng, tất cả hình ảnh được ghỉ lại là ảnh màu độ phân giải 720 x 576 pixel
2.2.4 IMM Face Database
Cơ sở dữ liệu khuôn mặt IMM duge ghi nhận vào năm 2001 tại Cục Tin hoc va Mô
Hình Toán Học - Đại học Kỹ thuật Đan Mạch Cơ sở dữ liệu chứa hình ảnh của 40
người, 33 nam và 7 nữ Nó đã được phi lại trong một lần và bao gồm 7 hình ảnh mỗi người do đó có tổng cộng 240 hình ảnh, 7 hình anh của mỗi người được chụp trong những nét mặt, ánh sang và camera divin anh (camera view point) khéc nhau,
Hau hét các hình anh được phí lạt trong ảnh máu tong khi phần còn lai được ghi lại
trong ảnh màu xám, FẤI cả đến có độ pháo giải 640 x 4860 diém anh Diệm mốc chú
thích đựa trên 48 dine wide luảng hình có sẵn,
2.2.5, MM Frantal Face Database
Cơ sở dữ liệu phía nước mật IMM được ghỉ nhận vào năm 2005 tai Cuc Tin hoc va
Mô Hình Toán Học - Đại học Kỹ thuật Đan Mạch Các cơ sở dir hứa các hình
ảnh của 13 người, tất cả là nam giới Cơ sở dữ liệu được ghi nhận trong zz2! lán và
bao gồm 10 hình ảnh của mỗi người do đó có tổng 120 hình ảnh 1Ú hinh ảnh của
mỗi người được chụp thuộc biểu hiện trên khuôn mặt khác nhau Tất cả hình ảnh được ghi lại trong ảnh màu với độ phân giải 2560 x 1920 pixel Diém moc chú thích
dựa trên 73 điểm mốc chương trình có sẵn
2.2.6 PIE
Cơ sở dữ liệu Tư thế, ánh sáng và nét mặt ( PIE) được ghỉ nhận vào năm 2000 tại
Đại học —_ Mellon 6 Pittsburgh Co sé dit liệu chứa các hình ảnh của 68
người ghỉ lại trong một lần Hơn 600 hình ảnh của mỗi người được đưa vào cơ xế
dữ liệu, kết quả có tổng số 41.368 hình ảnh Các hình ảnh được chụp dưới thay đổi nét mặt, camera điểm ảnh và ánh sáng Tất cả hình ảnh được ghi lại trong ảnh màu với độ phân giải 640 % 468 pixel
Trang 342.2.7.XM2VTS
Các đa cơ sở dữ liệu XM2VTS đã được ghi nhận tại Đại học Surrey Các cơ sở dữ
liệu chứa các hình ảnh, video và các mẫu âm thanh XM2VTS chứa các hình ảnh
của 295 người Mỗi người được ghi nhận trong 4 lần, mỗi lần bao gồm bốn hình ảnh
trên mỗi người, kết quả có tông số 4720 hình ảnh Các lần được ghi nhận trong thời
gian bốn tháng và được chụp ở phía trước và mặt nghiêng của khuôn mặt Tắt cả
hình ảnh được ghi lại trong ảnh màu với độ phân giải 720 < 576 pixel
2.3 Dùng Đặc Trưng Haar-like Trong Mô Hình Phân Tầng Tăng Cường
(BOOSTED CASCADES OF HAAR LIRE FEATURES)
231 ADAROOST (Adaptive Roostmg)
Trong một của số vàn hình ảnh 24 * 24 có hơn 160.000 đặc trum:
nhật], một số lượng lên hơn nhiều hơn so với số lượng điểm ảnh }
trưng có thể được tĩnh toàn rất hiệu quả nhờ ảnh tích hợp nhung tink
đầy đủ thì tên nhiều thời gian, Thách thức chính là tìm ra một s
trưng ma co thể kết hợp để tạo thành một phân loại hiệu quả Đề
tiêu này, các thuật toán học yếu được thiết kế để lựa chọn duy nhất đặc trưng hoặc
một số đặc trưng hình chữ nhật xuất hiện đồng thời mà tốt nhất ngăn cách các mẫu
(exambles) đương và âm
AdaBoost là một thuật toán học thống kê, nó hoạt động trên nguyên tắc kết hợp
tuyển tính các phân loại yếu (weak classifiers) đề hình thành một phân loại mạnh
(strong classifier) Với mỗi phân loại yếu sẽ quyết định kết quả cho một đặc trưng
hoặc một số đặc trưng Haar-like xuất hiện đồng thời (Joint Haar-like feature) bằng cách xác định ngưỡng với tỷ lệ lỗi nhỏ hơn 50
AdaBoost là một cải tiến của cách tiếp cận boosting được Freund và Schapire
đưa ra vào năm 1995 Trong quá trình huấn luyện AdaBoost sử dụng thêm khái niém trong sé (weight) để đánh dấu các mẫu khó nhận dạng, cứ mỗi weak classifiers duge x4y dựng, thuật toán sẽ tiến hành cập nhật lại trọng số để chuẩn bị cho việc xây dựng weak classifier kế tiếp: tăng trọng số của các mẫu bị nhận dạng,
23
Trang 35sai và giảm trọng số của các mẫu được nhận đạng đúng bởi weak classifier vừa xây
dựng Bằng cách này weak classifer sau có thể tập trung vào các mẫu mà các weak
classifiers trước nó làm chưa tốt Sau cùng, các weak classifers sẽ được kết hợp tuyến tính lại để tao nén strong classifier
Một biến thể của AdaBoost là sử dụng cả hai: tập đặc trưng và tập huấn luyện của các mẫu ảnh đương và âm để chọn ra một tập đặc trưng nhỏ và đào tạo phân
loại được gọi là Cascade Of Classifiers Trong hình thức ban đầu của nó, AdaBoost
là thuật toán học được sử đụng đề thúc đầy (Boosting) hiệu suất phân loại của một
thuật toán học đơn giản (còn gọi là thuật toán học yêu),
Lịch sử của Hoosting bất nguồn từ câu hoi nội tiếng được đưa ra bơi Michale
Kearns vào năm 1089) “Lien võ te tạo ra một bộ phân lớp mạnh (12 classifier)
từ một tập cúc hà phản kaii về (veak classjfier ?”), Năm 1990, Robert Schapire
đưa ra thuật toàn boosting đầu tiên, Freund đã tiếp tục các nghiên cứu v2 đến nám
1995 thị ông cảng vài Schapire phat trién boosting thanh adaboost
Nguyên ly cử bản của boostng là sự kết hợp các weak cla en
strong classitier Trong do, céc weak classifiers chi can có độ chín
Khi kết hop ching lai chung ta cé mét strong classifier cé độ chính
vậy, chúng ta nói bộ phân loại đã được “boosting”
Để hiểu cách hoạt động của thuật toán boosting, chúng ta xét một bài toán phân loại 2 lớp (mẫu cần nhận dạng chỉ thuộc một trong hai lớp) với O Ja tap huấn luyện gồm có m mẫu Trước tiên, chúng ta sẽ chọn ngẫu nhiên ra mạ mẫu từ tập O (m¡<m) để tạo tập O Sau đó, chúng ta sẽ xây dựng weak classifier đầu tiên Lị từ
tập O¡ Tiếp theo, chúng ta xây dựng tập O; để huấn luyện bộ phân loại Lạ O; sẽ được xây dựng sao cho một nửa số mẫu của nó được phân loại đúng bởi Lị và nửa
còn lại bị phân loại sai bởi Lạ Bằng cách này, O; chứa đựng những thông tin bổ sung cho Lạ Bây giờ chúng ta sẽ xây huấn luyện Lạ từ Os
Tiếp theo, chúng ta sẽ xây dựng tập O¿ từ những mẫu không được phân loại
tốt bởi sự kết hợp giữa Li và Lạ: những mẫu còn lại trong O mà Lị và Lạ cho kết
quả khác nhau Như vay, O3 sé gồm những mẫu mà L¡ và Lạ hoạt động không hiệu
phân loại Lạ từ O3
Trang 36'Bây giờ chúng ta đã có một strong classifier: sự kết hợp Lạ, Lạ và Lạ Khi tiến hành nhận dạng một mẫu X, kết quả sẽ được quyết định bởi sự thỏa thuận của 3 bộ
Lụ, Lạ và Lạ: Nếu cả Lị và Lạ đều phân X vào cùng một lớp thì lớp này chính là kết
quả phân loại của X; ngược lại, nếu Lị và L phân X vào 2 lớp khác nhau, C3 sẽ
quyết định X thuộc về lớp nào
Sau đây là ví dụ vé AdaBoost
Vi dy 2.1: AdaBoost Cho một tập gồm các mẫu dương (xanh) và mẫu âm (đỏ) như hình a Cac miu nay sẽ được đưa vào vòng lấp t= 1, ,T hình b Nếu tỉ lệ lỗi lớn hơn 0.5 thì thoát khởi vòng lần ngày tức khắc
Trang 37
e f(x) là giá trị đặc trưng Haar-like
« _ p là một chẵn lẽ để thay đổi dấu của bất đăng thức
© Ølàngưỡng
Ví dụ nếu ta dùng 3 đặc trưng Haar-like xuất hiện đồng thời: J = (101); = 5
> Thuật toán Adaboost dùng một đặc trưng Haar-like được mô tả như sau:
+ Cho tập n mẫu huấn luyện {Œ4, y\), (X2, ÿ›), (Xo, ya)}; Với xị c X (không
gian vector) và y; € {-1,+1} (14 phân loại); ¡ = 1, n
4 Khởi tạo phân trọng số ban đầu cho mỗi mẫu: D;(¡) = =
Đặt vòng lặp t= l, ,T
BI: Huấn luyện chọn weak classifier h,(x) với tỷ lệ lỗi €, nhỏ nhất trên Dr:
1 ÿƒp,#,(%)<P®, 1 #/Œœ)>9,
»60=|g gilernbé: Hay hŒœ) L #œ)<8 (2.8)
Trang 38Trong đó: /; là giá trị đặc trưng Haar-like
p, là một chẵn lẽ để thay đổi dấu của bất đẳng thức
6, là ngưỡng sao cho tỷ lệ lỗi nhỏ nhất
B2: Tìm tỉ lệ lỗi: €, = DED, ma y; # hy(x;) ;— h= arg min €; ,
Uang sé chuẩn hóa Z¿ = 2/€¿ (1 — &,) (2.12)
4 BG phan lop mạnh được xây dựng;
Hộ) = siạn QJ-y œ;hị(3)) = sign(ahj@) +asha(6) + + abn) G13)
>_ Thuật toán Adaboost dùng nhiều đặc trưng xuất hiện đồng thời (Joint Haar-Ìike)
được mô tả như sau:
+ Cho tập n mẫu huấn luyện {Œ4, y¡), Œe, ÿ),.-., (Xe Ya)}; Với xị c X (không
gian vector) va y; € {-1,+1} (là phân loai); i= 1, n
+* Khởi tạo phân trọng số ban đầu cho mỗi mau: D, (i) = _
Trong đó: J, là giá trị đặc trưng Joint Haar-like
p, mét chẵn lẽ để thay đổi dầu của bất đẳng thức
27
Trang 399, là ngưỡng sao cho tỷ lệ lỗi nhỏ nhất B2: Tim ti lé 16i: €, = DL, D, (i) ma y; # A, (x;) ; > b= arg min €, ,
nếu €,> 5 thì kết thúc vòng lặp hiện tại (2.15)
1 B3: Tìm mức độ đóng góp của hự: a, = sim int >0 (2.16)
ee B4: Cập nhật trọng số
Din = AO ema: néu y= h(x)
Dei) = : e*+; nếu vị # h,(X,)
Trong đó:
Hing sd chadu hoa Z, = 2, f€; A> €) (2.18)
4 BO phan lop man duce say dmg:
H(x) = sign (XP , ay hy (4) = sien(aihi(X) †aaha(x) + + adQx)) (2.19)
Phần này mô tả một thuật toán để xây dựng một thác phân loại (Viola và Jones,
2001) đạt được tăng hiệu suất phát hiện cao trong khi triệt để giảm thời gian tính
toán Các bộ phân loại tăng cường được xây dựng để loại bô các cửa số con âm
(negative sub-windows) và phát hiện hầu thế các của số con dương (positive sub- windows) Các phân loại đơn giản được sử dụng để loại bỏ phân lớn các cửa số con
trước khi bộ phân loại phức tạp hơn được gọi ra để đạt được tỷ lệ dương tính giả thấp
Trang 40Một thác phân loại là cây quyết định thoái hóa mà mỗi đoạn là một phân loại được huấn luyện để phát hiện hầu hết các đối tượng quan tâm trong khi từ chối một
phần nhất định các mô hình không phải đối tượng quan tâm Mỗi tầng được đào tạo
bằng cách sử dụng thuật toán AdaBoost
Có các phiên bản được sửa đổi của AdaBoost như Real-Boost, KLBoosting va
FloatBoost Hau hét các phương pháp này xây dựng một bộ phân loại yếu bằng cách
chọn một đặc trưng từ tập đặc trưng Tuy nhiên, hiệu suất tổng quát không còn được cải thiện trong vòng sau của qua trình tầng (boosUng process) bởi vì nhiệm vụ phân
loại chỉ sử dụng một đặc trưng trồ nén khó khan hơn, Viola va Jones cho biết đặc
trưng mà đã được lụa chọn trong các vòng sau đó máng lại Ú lệ lỗi khoang 0,4 đến
0,5 trong khi các đặc Hung đuạc lựa chọn vào vòng đầu có tỷ lệ lỗi giữz 6,1 va 0,3
hiểm suất
Như vậy quả nhiền phán loại yêu Không góp phần nâng cao tong
trong khi nó có thế lâm giam lỗi đảo tạo, Bat ky thuật toán thúc đây tizä ví náo cũng
sé phai dai mat vor van để nảy Dùng phương pháp đơn giản nhất, Jam tang số
lượng hình chữ nhật là khong khả thí bởi vì nó cần quá nhiễu thời gian cho việc
học, Đề giải quy ết vấn để này, đặc trưng joint Haar-like feature ding
khuôn mặt nó dựa trên xuất hiện đồng thời của nhiều đặc trưng Haar-like Đặc trưng
đồng thời xảy ra nắm bắt được đặc điểm của khuôn mặt của con người, làm cho nó
có thể để xây dựng một bộ phân loại mạnh hơn Các đặc trưng joint Haar-like có thê
được tính toán rất nhanh độc lập với độ phân giải hình ảnh và có chống lại tiếng ồn
và sự thay đổi ánh sáng mạnh mẽ
Sau đây là thuật toán thác phân loại:
% Đầu vào:
© _ Đưa một tập huấn luyện gồm P là những mẫu đương và N là những, mẫu âm
© Foor 18 tỷ lệ dương tính giả tổng thể tối đa có thể chấp nhận được của thác
phân loại Nếu có n tầng thì ta có Fmax = fmax
© f„„„ là tỷ lệ dương tính giả tối đa có thể chấp nhận được của mỗi ang (0.5)
29