1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Nhận dạng khuôn mặt người từ camera dùng Đặc trưng haar like kết hợp với giải thuật cascade của boosted classifier trên opencv

88 0 0
Tài liệu được quét OCR, nội dung có thể không chính xác
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Nhận dạng khuôn mặt người từ camera dùng đặc trưng Haar - like kết hợp với giải thuật cascade của boosted classifier trên opencv
Tác giả Bùi Đức Vũ
Người hướng dẫn TS. Lê Mỹ Hà
Trường học Trường Đại Học Sư Phạm Kỹ Thuật Thành Phố Hồ Chí Minh
Chuyên ngành Kỹ Thuật Điện - Điện Tử
Thể loại Đồ án tốt nghiệp
Năm xuất bản 2015
Thành phố Thành phố Hồ Chí Minh
Định dạng
Số trang 88
Dung lượng 8,65 MB

Nội dung

Do đó để bảo vệ quyền lợi, tải sản của cá nhân, tập thể hay công ty và hơn thể nữa là bảo vệ quốc gia, xã hội là một nhiệm vụ rất cẦn thiết, VÌ vậy đã xuất hiện nhiều kỹ thuật để xác mì

Trang 1

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRUONG DAI HOC SU’ PHAM KY THUAT

THÀNH PHÓ HÒ CHÍ MINH

HGMUIIE

ĐỎ ÁN TÓT NGHIỆP NGÀNH KỸ THUẬT ĐIỆN - ĐIỆN TỬ

NHẬN DẠNG KHUÔN MẶT NGƯỜI

TỪ CAMERA DÙNG ĐẶC TRƯNG HAAR - LIKE

KÉT HỢP VỚI GIẢI THUẬT CASCADE

CUA BOOSTED CLASSIFIER TREN OPENCV

GVHD: LE MY HA SVTH: BÙI ĐỨC VŨ

SKLOO

Trang 2

LỜI CAM ĐOAN

Em cam đoan đây là công trình nghiên cứu của Em

Các số liệu, kết quả nêu trong luận vân là trung thực và chưa từng được ai công

bố trong bất kỷ công trình nảo khác

tp He Chi Minh, nyay 17 thang 1 nam 2015

(Ký tên 9 øi rõ họ tên)

Trang 3

LỜI CẢM ƠN

Em xin chân thành cảm ơn quý thầy cô trong bộ môn Điện Tử Công Nghiệp đã

trang bị cho Em kiến thức và giúp đỡ Em giải quyết những khó khăn trong quá trình làm đỗ án

Đặt biệt Em xin chân thành cảm ơn Thấy bướng dẫn, T.S Lê Mỹ Hà đã tận tình

giúp để trong quá trình lụa chọn đề tải và hồ trợ 3h trong quá trình thực hiện

Sinh viên

Bùi E

Trang 4

TOM TAT

Bên cạnh những ưu điểm của sự bùng nỗ công nghệ thông tin vả sự phát triển của công nghệ cao thì không thể phủ nhận một điểu là những vấn đề của xã hội hiện đại xuất hiện theo chiều hưởng tăng cao và ngày cảng nguy hiểm như tội phạm công

nghệ cao, khủng bố, hackers, vv Do đó để bảo vệ quyền lợi, tải sản của cá nhân,

tập thể hay công ty và hơn thể nữa là bảo vệ quốc gia, xã hội là một nhiệm vụ rất cẦn thiết, VÌ vậy đã xuất hiện nhiều kỹ thuật để xác mình, xác định một người trong,

an mình, bảo mat hay gián sát Trong số đó, có thé nói đến hệ thing nhận dạng mặt người bảng hìuh ảnh Nhân dạng mật người là xử lý một ảnh hay i2 42nz video để xúc định danh tình tự động cho từng người dựa vào nội dung của 2y:

Nhận dang mat người được ứng dụng trong thực tế như kiểm soát truy cáp cho tòa nhà, sản bay, cảng biển, các trạm kiểm soát biên giới, giám xác tội pham ma túy, tội phạm khủng, bố, camera chống trộm, máy ATM, hệ thống chấm

gìử xe siêu thị, vy Tuy nhiên, Các ứng dụng nhận dạng khuôn mát vượt xa giới hạn cho hệ thông an ninh Tự động nhận dạng khuôn mặt có thê được sử đụng trong

rất nhiều lĩnh vực khác ngoài hướng đi ứng dụng bảo mật (kiểm soát truy cập / hệ thống kiểm tra, giám sát hệ thống), chằng hạn như máy tính giải trí và tùy chỉnh

tương tác máy tính - con người Các ứng dụng tùy chỉnh tương tác máy tính - con người trong tương lai gần sẽ được tìm thấy trong các sản phẩm như xe hơi, hỗ trợ

cho người tàn tật, vv

Trong Đồ Án Tốt Nghiệp này của em chủ yếu tập trung vào phần cứng nhận

đạng khuôn mặt người trong điều kiện ánh sáng ổn định và khuôn mặt không quá nghiêng Dùng một camera để thu nhận ảnh, đữ liệu thu được sẽ được chuyển vào máy tính Sau đó, trên máy tính sẽ chạy chương trình nhận đạng khuôn mặt người dùng dữ liệu được thu nhận từ camera đó Ở đây, dùng đặc trưng Haar-like để trích xuất những cấu trúc cục bộ mà tương đồng với những cấu trúc như trong mặt người,

dùng AdaBoost để chọn những đặc trưng tối ưu nhất để tách khuôn mặt và không,

iii

Trang 5

phải khuôn mặt, dùng thác phân loại (Cascade of Classifiers) để phát hiện hoặc

nhận dạng một cách nhanh chóng và chính xác, đáp ứng được các ứng dụng thời

gian thực Các kết quả nghiên cứu trước đây cho kết quả rất khả quan, độ chính xác

cao

Trang 6

ABSTRACT

Nowadays, the more information technology has developed rapidly and strongly with their advantage, the more complicated the modern society has.High-technology

crime, terrorist, hackers, ect have increased and dangerous Therefore, finding the

ways to protect things of personal eflect, group, company and national are the very important Wike, Ag a fesnlt, a let of technology to verily sormeone in security or

superviaon, Anony there aolitns, recognizing face by mage i 44 mentioned Recognising fice te the inage or video processing to define someone's identity up

fo content af nape antatcally,

Recopniving fice is applied on access controlling of building

(rentice mspection post, drug criminal, terrorist, camera

he machine,

computer and interaction between computer — human that can be applic

supported invalid in a near future

In this thesis, we were mainly focused on facial recognition hardware with stable

light condition and the faces are not too inclined Using a camera for image acquisition, data collected will be transferred to the computer Then the computer

will run the face recognition application using data obtained from this camera Here,

Haar-like features are used to extract the local structure that resembles the structures

on human faces Then, AdaBoost algorithm is utilized for selecting the optimal

features to separate the face and not the face objects The Cascade of Classifiers can

detect or identify the objects quickly and accurately, to meet the real-time

applications The experiments pointed out that this method gives promising result with high precision

Trang 7

MỤC LỤC

LỜI CAM ĐOAN 6S cc

1.1.1 Lich Sử Phát Triển Của Nhận Dạng Khuôn Mặt Người

1.1.2 Một Vài Nghiên Cứu Nhận Dạng Khuôn Mặt Trước Đây

Trang 8

2.1 Các Loại Đặc Trưng Thường Dùng Để Nhận Dạng Khuôn Mặt Người 12

3.1.2 Camera Honeywell HCD484EX

3⁄2 Giao Tiếp Giữa Camera Với Máy Tính

Trang 9

4.2 Các Phương Pháp Nhận Dạng Khuôn Mặt Trong OpenCV

4.3 Nhận Dạng Khuôn Mặt Từ Camera Trong OpenCV Dùng Fisherfaces

43.1 Sơ Đồ Thuật Toán

4.3.2 Tạo Một Tập Dữ Liệu Khuôn Mat Cita Người Cần Nhận Dạng Và Một File CSV.ext

Hình 1.1: So sánh khả năng tương thích sáu kỹ thuật sinh trắc học (mặt, ngón tay,

bản tay, giọng nói, mắt, chữ ký) với máy tính có thể đọc được giấy tờ đi lại

Trang 10

Hình 1.2: Bốn bước chung trong nhận dạng khuơn mặt

Hình 2.4: Ví dụ cách tinh nhanh các giá trị mức xám cửa vũng D trên ảnh 4

Hình 3,4; Minh họa về ảnh tích chấp và cách tỉnh giá trị mức xá¡n Kesevrsusrxoll Bố)

Hình 36 Đúng đặc túng Liaat-hÉe để trích các đặc trưng khuơ wld

Hinh 3: Dũng đặc trưng Nậi- like trong phát hiện và nhận điện ki

Hình 28 Hình đang của 40 bộ lọc Gabor[3]

Hình 29: (a) Phần thực của hạt nhân Gabor tai nam quy mơ và tám

ân kaay C3, và F= 212 (b) độ lớn của hạt nhin Gabor tai nam #

Hình 3.2: Dell Vostro 5560 V5560A

Hình 3.3: Camera Honeywell HCD484EX

Hình 4.1: Sơ đồ cấu trúc của OpenCV

Hình 4.2: Local Binary Patterns hay ma LBP

Trang 11

Hình 4.3: Sơ đồ thuật toán nhận đạng khuôn mặt người dùng Fisherface

Hình 5.1: Kết Quả Thực Nghiệm

Trang 12

Chương 1

TỎNG QUAN

1.1 Tổng Quan Về Nhận Dạng Khuôn Mặt Người

Nhận dạng khuôn mặt người là một trong những ứng dụng quan trọng của thị

giác máy tính (Computer Vision) nói riếng cũng như khoa học máy tính nói chung

Mặc dù nghiên cửu về nhận dạng khuôn mat ty dong đã được thực hiện từ những

nim 1960 nlm nó mới phát triển mạnh mệ trong hơn 16 nam trở lại đây bởi cộng

đồng khoa hạc, Nhiễn kệ thuật phần tích khuôn mật và kỹ thuật mó bính hóa đã tiến

bộ đáng kể Tuy nhiên, để chính xác của các hệ thống nhận đạng kz¿ôn mát trong

các điều kiện khác nhau vẫn còn là một thách thức đối với cộng bọc

Thời

man gan diy, nhận dạng khuôn mặt không những nhận được sự chú ý cộng

đồng Khoa học mà còn nhận được sự quan tâm của công ching Sự ở

công chúng nói chung chủ yếu là do tìm năng ứng dụng của nhận

mang lại, ví dụ tương tác giữa người và máy, video giám sát, vv

những vấn đề của xã hội hiện đại như sự giả mạo chứng minh nhân dán, sự xâm

nhập vật lý và lỗ hỏng của các mật khẩu alphanumerical ngày càng xuất hiện

thường xuyên trong các phương tiện truyền thông nên cần có cơ chế kiêm soát được chấp nhận rộng rãi cho việc xác định và kiểm tra cá nhân mà đem lại sự tin

cậy và thân thiện

Kỹ thuật dựa trên sinh trắc học đã nổi lên như là phương pháp nhận dạng cá nhân đầy hứa hẹn và đang dần thay thế cho các phương pháp tiếp cận truyền thống

(chẳng hạn như mật khẩu, mã PIN, các loại thẻ, chìa khóa, vv ) Sinh trắc học dựa

trên sự xác thực về các khía cạnh đặc điểm nội tại của một con người cụ thể như khuôn mặt, dấu vân tay, hình dáng ngón tay, hình bàn tay, tĩnh mạch tay, lòng bàn

tay, mống mắt, võng mạc, tai và giọng nói, nó không bị lãng quên, đánh cắp hay giả

mao như các phương pháp truyền thống.Trong số các kỹ thuật sinh trắc học lâu đời

Trang 13

nhất là nhận đạng vân tay Kỹ thuật này đã được sử dụng ở Trung Quốc để xác nhận

sự chính thức của hợp đồng Sau đó, vào giữa thế kỷ 19, sf được sử dụng để xác định người ở châu Âu Một kỹ thuật sinh trắc học hiện tại đang phát triển là nhận

dang méng mat hay còn gọi là tròng den(iris) KY thuat nay hién nay được sử đụng

thay thế xác định hộ chiếu cho người đi thường xuyên ở một số sân bay trong

United KingDom , Canada và Netherlands Cũng như kiểm soát truy cập của người lao động tại các khu vực cấm như sản bay cua Canada va tai san bay New Yorks

JFK Những kỹ thuật này là bất tiện do cần có sự tương tác với những người được xác định và chúng thực, Nhân đang khuôn miật nắm giữ nhiều lợi thế hơn các kỹ

thuật ginh trắc học khác, đó là tự nhiên, không xâm nhập và dễ sử dụng, điều này

đặc biệt có lợi cha các mục địch an nình và giám sát, Đây là một trong những lý do tại sao kỹ thuật này đã tui bit sự quan tam tang dần từ cộng đông kbz4 học trong 1Ú nầm gần đáy Trong miột nghiên cứu xem xét các khả nắng tươyg tôích sáu kỹ thuật sinh trắc học (mật, ngón tay, bàn tay, giọng nói, mắt, chữ ký) với tính có thể đọc được giấy tdi lai (Machine Readable Travel Documents - M2 TD) {1} Đặc

điểm Khuôn mặt chiếm tỷ lệ phần trăm khả năng tương thích cao nhét, xem hinh

1,1, Trong nghiên cứu này các thông số như tuyển sinh( kết nạp), đổi mới yêu cầu máy tính và nhận thức của công chúng được xem xét Tuy nhién, đặc điểm khuôn mặt không nên được coi là sinh trắc học đáng tin cậy nhất Các ứng dụng nhận dang khuôn mặt đang ở xa giới hạn cho hệ thống an ninh Tự động nhận dạng khuôn mặt

có thể được sử dụng trong rất nhiều lĩnh vực khác ngoài hướng đi ứng dụng bảo mật (kiểm soát truy cập / hệ thông kiểm tra, giám sát hệ thống), chẳng hạn như máy tính -giải trí và tùy chỉnh tương tác máy tính - con người Các ứng dụng tùy chỉnh tương tác máy tính - con người trong tương lai gần sẽ được tìm thấy trong các sản phẩm

như xe hơi, hỗ trợ cho người tàn tật, các tòa nhà, vv

Trang 14

Face Ginger Hand Voice tực #g/xature |

Hinb 1.1: So sdnt kha nang tueng thich sáu kỹ thuật sinh trắc hợc (mát, ngớn tay,

bản tay, giọng nói, mắt, chữ ký) với máy tính có thể đọc được giáy tớ đi lại

(MRTD) [1]

Do sự phát triển của công nghệ chẳng hạn như siêu máy tính , kít nhúng có tốc

độ xử lỷ cao, máy ảnh kỹ thuật số, internet, vv và do một nhu cầu lớn hơn cho các

chương trình bảo mật khác nhau mà số lượng của các ứng dụng nhận dạng khuôn

mặt tự động sẽ tăng nhiều hơn trong tương lai Mac di con người là chuyên gia

trong nhận dạng khuôn mặt nhưng chưa hiểu rõ được làm thế nào để nhận dạng

chính xác được trong mọi hoàn cảnh khác nhau của đối tương Trong nhiều năm psychophysicists và nhà thần kinh học đã được nghiên cứu xem nhận dạng khuôn

mặt được thực hiện một cách toàn diện hoặc bằng cách phân tích các đặc điểm cục

bộ, tức là nhận dạng khuôn mặt được thực hiện bằng cách nhìn vào khuôn mặt như

một toàn bộ hoặc bằng cách nhìn vào đặc điểm khuôn mặt của cục bộ một cách độc lập

1.1.1 Lịch Sử Phát Triển Của Nhận Dạng Khuôn Mặt Người

Cách trực quan nhất để thực hiện nhận dạng khuôn mặt là nhìn vào các đặc trưng chính của khuôn mặt và so sánh các đặc trưng này với các đặc trưng tương tự khác

Trang 15

trên khuôn mặt Một số các nghiên cứu sớm nhất về nhận đạng khuôn mặt được

thực hiện bởi Darwin và Galton Công việc của Darwif bao gồm phân tích các biểu

hiện khác nhau trên khuôn mặt do trạng thái cảm xúc khác nhau, trong khi đó

Galton nghiên cứu các mặt nghiêng của khuôn mặt Tuy nhiên, cố gắng đầu tiên để

phát triển hệ thống nhận dạng khuôn mặt bán tự động bắt đầu vào những năm cuối thập niên 1960 và đầu những năm 1970, và được dựa trên thông tin hình học Ở

đây, điểm mốc được đặt trên các bức ảnh định vị các đặc điểm lớn của khuôn mặt,

chẳng hạn như mãt, tai, môi, và góc miệng, Khoảng cách tương đối và góc được

tính từ những điểm móc này đến một điểm tham chiếu chúng và so sánh với dữ liệu

tham kháo(referenee data)

ém mộc chủ Gollsteii và các công sự (1971) tạo ra được một hệ thống của Z1

quan, chàng hạn nhữ tan tác và độ dày môi Những, điểm móc dug

rất khỏ để tụ đồng hóa do tính chất chủ quan của nhiều người troz

vẫn lầm hoàn toàn bằng lay,

an phù hợp hơn để làm nhận dạng khuôn mặt đã được thực hiện

Một cách tiệp

bởi Fischler và các cộng sự (1973) và sau đó là Yuille và các cệ

Phương pháp này đo đặc điểm khuôn mặt bằng cách sử dụng mẫu của cá

không đôi trên khuôn mặt và ánh xạ các đặc trưng này lên mau chung( global)

Tom lại, hẳu hết các kỹ thuật phát triển trong giai doan dau tién cua nhan dang

khuôn mặt tập trung vào tự động phát hiện các đặc trưng của khuôn mặt cá nhân

Ưu điểm lớn nhất của phương pháp này dựa trên đặc trưng hình học, các đặc trưng này là không nhạy với ánh sáng và sự hiểu biết trực giác của con người về trích xuất đặc trưng Tuy nhiên cho đến ngày nay việc phát hiện đặc trưng khuôn mặt và kỹ thuật đo lường là không đủ tin cậy cho việc công nhận đặc trưng dựa trên hình học của một khuôn mặt và một mình tính chất hình học là không đủ để nhận dạng khuôn

Do những hạn chế của nhận dạng khuôn mặt dựa trên đặc trưng hình học nên kỹ

thuật này đần đần bị loại bỏ và một kỹ thuật đựa trên màu sắc tổng thể đã được thực

Trang 16

màu sắc tổng thể sắp xếp một tập các gương mặt khác nhau để có được một sự

tương ứng giữa các cường độ điểm ảnh, một phân loại vùng lân cận nhất có thể

dùng để'phân loại các gương mặt mới khi nó xuất hiện lần đầu tiên trên ảnh, đó là

kỹ thuật Eigenfaces - một phương pháp học tập thống kê Thay vì so sánh trực tiếp

các cường độ điểm ảnh của những hình ảnh trên khuôn mặt khác nhau, kích thướt

của các cường độ đầu vào lần đầu tiên đã được giảm bằng một phân tích thành phần

chính (PCA) trong kỹ thuật Eigentace Eigenfaccs lä một thành phần cơ sở của rất

gương mặt cả nhần rang Fshetfaces, kích thước của các cường ổi ctor đâu vào

được PCA lầm giảm và sau đó FLDA được áp dung dé có được mm

ưu để phần tách các khuôn mặt từ những người khác nhau

Sou sy phát trên của kỹ thuật Fisherface, nhiều kỹ thuật liên quan đã được để

1.1.2 Một Vài Nghiên Cứu Nhận Dạng Khuôn Mặt Trước Đây

DangBao, phát hiện và nhận dạng khuôn mặt dùng kỹ thuật fisherfaces trên

OpenCV, ngày 17 tháng 9 năm 2013

Dr Domenico Daniele Bloisi, phát hiện khuôn mặt đùng thác phân loại , ngày 1 tháng 7 năm 2014

Faten Bellakhdhar, Kais Loukil and Mohamed ABID, nhận dạng khuôn mặt ding Gabor Wavelets, PCA va SVM”, thang 3 nam 2013.

Trang 17

Sharif, Sajjad Mohsin, Muhammad Younas Javed, và Muhammad Atif Ali kết

hợp thuật toán Laplacian of Gaussian (LoG) và DCT năm 2012

Suhas, Kurhe Ajay B., va Dr Prakash Khanale B áp đụng PCA kết hợp với DCT

theo hướng tiếp cận toàn diện năm 2012

Sunil nhận đạng khuôn mặt dùng PCA kết hợp voi DCT năm 2013

Trịnh Tấn Đạt, Phạm Thế áo, nhận dạng mặt người dùng đặc trưng GABOR

kết hợp ADABOOST và K-MEA", năm 2013

Bonzalmal, Jamal Khartoubi và Arnalane Z2iphili nhân dạng khuôn mặt người

trên ảnh áp dụng thuật toán máy học SVM dụa tiên LOA nấm 2013

Gan day hidnp tiép can diva wen cde đặc trưng cục bộ khóng đối SIFT của

Lowe (2004) shige quan tam nhiều Đặc trưng cục bộ SIFT không f ay đôi trước

những biển đốt tý Íe ảnh, tình tiện, phép quay, không bị thay đối ø

phép biển đòi hình học atine (thay đổi góc nhìn) và mạnh với r đối về độ

súng, sự nhiều và che khuất, Aiy (2006) sử dụng các đặc trưng SIFT dạng

mặt người, Chennanama, Lalitha Rangarajan, và Veerabhadrapp: áp dụng

thuật toán so khớp SIFT để nhận dạng khuôn mặt trên tập anh đã lọc

trước, đồng thời so sánh kết quả nhận dang voi thnat toan phan tich thanh phan

chinh Shinfeng, Jia-Hong Lin, va Cheng-Chin Chiang (2011) kết hợp phương pháp

phân tích thành phần chính và đặc trưng SIFT để nhận dạng khuôn mặt người

Kumar và Padmavati (2012) đã đề xuất các cách tính khoảng cách khác nhau khi so

khớp các đặc trưng SIFT để nhận đạng mặt người, góp phần cải thiện tốc độ so khớp các đặc trưng SIFT [2]

Kết luận : Các phương pháp hiện tại cho nhận điện khuôn mặt có thể được chia

thành hai phương pháp chính: phương pháp dựa trên tổng thể hình ảnh và phương

pháp dựa trên các đặt trưng hình học Do những hạn chế đã nêu trên nên phương

pháp nhận dạng dựa trên các đặt trưng hình học ít được sử dụng mà chủ yếu sử

dụng phương pháp dựa trên tổng thể hình ảnh để nhận dạng khuôn mặt Phương

Trang 18

Discriminant Analysis - LDA), phân tích thảnh phần độc lập (Independent

Component Analysis — ICA), máy hỗ trợ vector (Support Vector Machines — SVM),

mang Neural, Adaboost Using Haar Classifiers, vv

Hệ thống nhận dạng khuôn mặt thường bao gồm bốn bước, được thể hiện trong hình 1.2, phát hiện khuôn mặt (định vị trí, tiền xử lý khuôn mặt, khai thác các đặc trưng và so khớp các đặc trưng

"Vũng ảnh con chứa khuôn mật

Ảnh hose

Hình 1.2: Bốn bước chung trong nhận đạng khuôn mặt

Ba nhiệm vụ chính trong nhận dạng khuôn mặt thường dùng là:

e Xác mình (xác thực): Nhiệm vụ xác minh là nhằm mục đích ứng dụng yêu cầu tương tác người dùng trong một hình thức tuyên bó danh tính, tức là các

ứng dụng truy cập

e_ Xác định (công nhận): Nhiệm vụ xác định chủ yếu là nhằm vào các ứng dụng không yêu cầu tương tác người dùng, nghĩa là ứng dựng giám sát

© Danh sách theo đõi: Nhiệm vụ danh sách theo dõi là một sự tổng quát của

nhiệm vụ xác định bao gồm những người chưa biết và đã biết danh tính

Có 3 vấn đề cần cân nhắc trong quá trình nhận dạng khuôn mặt đó là:

©_ Các biến thể khuôn mặt của các cá nhân khác nhau có thể là rất nhỏ và một

cá nhân lại có thể xuất hiện nhiều biến thể khuôn mặt khác nhau do tư thế,

Trang 19

điều kiện ánh sáng, cảm xúc của khuôn mặt, chất lượng của thiết bị thu nhận anh, wv

e Sự đa dạng phi tuyến tính xuất hiện trên hình ảnh khuôn mặt tức là xuất hiện những mẫu không phải là khuôn mặt người nhưng lại hiểu sai nó là khuôn

mặt người

© Không gian đầu vào đa chiều (high-dimensional input space) và chỉ có một

số lượng nhỏ hình mẫu của một cá nhân do đó xuất hiện vấn đề là khó mà có

thể thực hiện xấp xỉ một ảnh cá nhân trong không gian đa chiều đó

Không gian khuôn mặt

Hình 1.3: Minh họa vấn đề không gian đầu vào đa chiều va chỉ có một số lượng

nhỏ hình mẫu của một cá nhân Các mẫu được đánh dấu bằng vòng tròn màu đỏ

1.13 Định Hướng

Các phương pháp dựa trên Eigenfaces, phân tích thành phần chính (Principal

Component Analysis - PCA), phân tích tuyến tính tách biệt (Linear Discriminant

Analysis - LDA), phân tích thành phần độc lập (ndependent Component

Trang 20

Analysis — ICA), máy hỗ trợ vector (Support Vector Machines — SVM), mạng

Neural, vv Hầu hết các thuật toán sử dụng giá trị điểm ảnh thô như các đặc trưng

và rất nhạy cảm với tiếng ồn và sự thay đổi trong chiếu sáng Thay vào đó, các đặc

trưng Haar-like mã hóa khác biệt trung bình cường độ giữa hai khu vực hình chữ

nhật, và họ có thể trích xuất kết cấu không phụ thuộc vào cường độ tuyệt đối

Đặc trưng Haar-like trích xuất được những cấu trúc cục bộ mà tương đồng với

những cấu trúc như trong mặt người, các đặc trưng Haar-like tính toán rất nhanh, ít

bị ảnh hương bởi tiếng ồn, sự thay đổi của ánh sáng vá hiện suất phát hiện cao nên

được dùng đề phát hiện và nhận đang khuôn mit người

Adnlionat còn được pụt là phương pháp máy học tăng cường, nó hoạt đóng trên

nguyên tắc kết lay uyên tính các phan loai yéu (weak classifiers) 4é 5 thành

một phần hoat mạnh (suong classifier) Né lam giảm đáng kể những mẫu không

phải là Khuôn mặt một cách nhanh chóng

Số lượng đặc trưng trên một mẫu là khá lớn, ví dụ ảnh có kích t2

sắp xì 160.000 đặc trưng [3] nhưng không phải mẫu nào cũng k5ó

nhận dạng có những mẫu chỉ cần một đặt trưng hoặc một vải đặc trưng i¿ phát hiện hoặc nhận được rồi vì vậy sử dụng thác phân loại (Cascade of Classifiers) dé phat hiện hoặc nhận dạng một cách nhanh chóng và chính xác, đáp ứng được các ửng dụng thời gian thực

Vì những lý do trên, Trong, Đề Án này Nhóm em sử dụng đặc trưng Haar-like

kết hợp với thuật toán AdaBoost trên mô hinh Cascade of Classifiers để nhận đạng khuôn mặt người từ camera trên nền tảng OpenCV

1⁄2 Mục Đích Của Đề Tài

Xây dựng được hệ thống phát hiện và nhận dạng khuôn mặt người trên 90% từ

camera dùng đặc trưng Haar-like kết hợp với giải thuật Cascade của Booted Classifiers trên OpenCV

Trang 21

143 Giới Hạn Đề Tài

s - Nhận dạng được khuôn mặt từ 90% trở lên

» Điều kiện ánh sáng ổn định, không quá sáng hoặc quá tối, khoảng cách từ

0.35m đến 1.5m

s - Khuôn mặt không quá nghiêng

1.4 Phương Pháp Nghiên Cứu

® - Phát hiện khuôn mặt:

Dùng mội khung cửa sé thay đói kích thướt, quét trên toàn bộ bình ảnh thu nhận

được tir camera Véi indi khing cửa số tà dùng đặc trưng Ífaar-like đề trích xuất

những cấu trúc cục hộ mã nang động với những cấu trúc nhu tre

Khuôn mặt guốt Vì số lượng đặc trưng trong một khung củ:

thuật toán Adaboost để chọn những đặc trưng tối ưu nhất đề tách k5zé

nền Để đáp ứng được thời gian thực, dùng thác phân loai (Cascade OF

để loại bỏ nhanh những của số không phải là khuôn mặt người

® - Nhận dạng khuôn mặt người:

Với khuôn mặt được phát hiện ở trên, ta so sánh với một tập dữ liệu khuôn mặt

của người cần nhận dang và một file CSV.ext để gán tên của người được nhận dạng Một trong những kỹ thuật nhận dạng hiện nay nữa là Fisherfaces, kỹ thuật này

được sử dụng rộng rãi và được đề cập nhiều Nó kết hợp các Eigenfaces với Fisher

Linear Diseriminant Analysis (FLDA), để có được một phân tách tốt hơn trong

những gương mặt cá nhân Trong Fisherfaces, kích thước của các cường độ vector

đầu vào được PCA làm giảm và sau đó FLDA được áp dụng để có được một phép

chiếu tối ưu để phân tách các khuôn mặt từ những người khác nhau

Trang 22

15 Tóm Tắt Đề Tài

Như vậy, với các yêu cầu về nhiệm vụ và Thục tiêu đê ra, luận văn được xây

dựng bao gồm các chương sau:

- Chương 1: Téng Quan Chương này trình bày khái quát về nhận đạng khuôn

mặt người, tầm quan trọng lịch sử phát triển và định hướng đề tài

- Chương 2: Cơ Sở Lý Thuyết Trong Nhận Dạng Mặt Người Chương này trình bảy cơ sở lý thuyết về nhận dạng, khuôn mặt

- Chương 3; Cấu Trúc Phần Cứng Chương nây trình bày về hệ thống phần cứng cần thiết cho: nhận đang khuôn mật người

Chương 4: Nhận Dạng Khuôn Mật Trong OpenCV, Chương này trình bày

một số nhường phát nhận dạng trên OpenCV

- Chương %' kết Qua Thực Nghiệm Và Đánh Giá Chương này trính bay cdc Kết qua dat được

+ Chương 6: Kết Luận Và Hướng Phát Triển

11

Trang 23

Hình 2.1: Bến đặt trưng Haar-like cơ bản

Để sử dụng các đặt trưng này vào việc xác định khuôn mặt người, 4 đặt trưng,

Haar-like cơ bản được mở rộng ra bằng cách xoay 45° và 90° và được chia làm 3 tập

đặc trưng như sau:

= Pic trung canh (edge features):

IIm

» _ Đặc trưng đường (line feature§):

Sor

Trang 24

= Dac trung trong tâm đường biên (center-surround features):

Hình 2.2: Các đặc trưng mở rộng của các đặc trưng Haar-]ike cơ sở

Dùng các đặc trưng trên, tạ có thể tính được giá trị của đặc trưng Haar-like là sự

chênh lệch giữa tổng giá trị của các pixel của các vũng den và các vùng trắng như

trong công thức snu:

fx) Lyi mịnn¿¡ ĐH trắng - Đau trịpixet tùng đen (2.1)

một khái niệm gọi là ảnh tích hợp (Integral Image), là một mảng 2 chiều với kích

thước bằng với kích của ảnh cần tính các đặc trưng Haar-like, với mỗi phản tử của mảng này được tính bằng cách tính tổng của điểm ảnh phía trên dòng trừ 1 và bên

trái cột trừ 1 của nó Bắt đầu từ vị trí trên bên trái đến vị trí đưới phải của ảnh, việc

tính toán này đơn thuần chỉ đựa trên phép cộng số nguyên đơn giản, do đó tốc độ thực hiện rất nhanh

13

Trang 25

Sau khi đã tính được ảnh tích hợp, việc tính tông các giá trị mức xám của một

vùng bắt kỳ nào đủ trên ảnh thực hiện rất đơn giản

Vi dul: Gia sir ta cần tính tổng các giá trị mức xám của vùng D như trơng hình

2⁄4, ta có thể tính như sau:

D= (4,4) ~ (%2,¥2) — (s.ys) + (yi) = (A +B + C + D)— (A+B) ~ (A+C) £ A

Với A +B+C +D chính là giá trị tại diém P, trên Integral Image, tương tự A+B

là giá trị tại điểm P;, A+C là giá tri tại diém Py, và A là giá trị tại điểm Pạ

Hình 2.4: Ví dụ cách tính nhanh các giá trị mức xám của vùng D trên ảnh

Trang 26

Anbgoe Ảnhtíchchập Ảnhgốc Ảnh tích chập

1J5|2 |5 9 |23|31144 1[5 | 2[5 9 |23|31|44

2+3+1+4+2+2=14 23-6-8+2=11 a) Ảnh tích chập b) Tính giá trị mức

xám từ ảnh tích chập

Hình 2.5: Minh họa về ảnh tích chập và cách tính giá trị mức xám

Nhận điện khuân mặt đàng đặc ưng Haar-like được thực hiện báng cách quét

một khung Ánh tại các quy mồ khác nhau trên ảnh và tìm kiếm một số mô hình đơn

giản mà xác định sự hiện diện của một khuôn mặt

Đặc trưng Haar-like có giá trị vô hướng đại diện cho sự khác biệt ở cường độ

trung bình giữa hai khu vực hình chữ nhật Các đặc trưng Haar-like nắm bắt cường

Trang 27

độ radient tại các địa điểm khác nhau: không gian, tần số và hướng bằng cách thay

đổi vị rí, kích thước, hình dáng và bố trí của các khu vực bình chữ nhật triệt để dựa

theo độ phân giải của máy đò do đó có thể phát hiện và nhận điện được khuôn mặt ở

Các Gabor wavelet thường được gọi là bộ lọc Gabor trong phạm vi các ứng

dụng Đặc trưng Gabor wavelet trích xuất các đặc trưng cục bộ của đối tượng mà

ta cần, chuẩn hóa và tối ru các đặc trưng đó trong miễn không gian (thời gian) và miền tần số tương tự như hệ thống thị giác của con ngươi và kích thước hạt nhân

của nó có thể được điều chỉnh cho phép nó dễ dàng thực hiện phân tích đa phân

giải Gabor wavelet trích xuất các đặc trưng trực tiếp từ những hình ảnh màu xám

Các đặc trưng Gabor wavelet nhận dạng khuôn mặt khá tốt, không những phát hiện

Trang 28

được khuôn mặt ở điều kiện độ sáng hay cảm xúc của khuôn mặt Các Gabor wavelet W,,„ được xác định như công thức sau:

Các Hìam số „ và v lần lượt là hướng và quy mô cua nhân Ciabor

Ø là độ lệch chuẩn của phản phối Gauss, |[.|| là toán từ chuấn

hua® be

` là một veclơ sóng

Ác Ko, °Ê” là tần số của sóng,

tọy— A|L§ là hướng của song

kua là tần số tối đa của song,

£` là hệ số khoảng cách giữa các nhân trong miễn tấn số

Số lượng Gabor wavelets được sử dụng thay đổi phụ thuộc vào các ứng dụng khác nhau, nhưng thường là 40 bộ lọc Sử dụng 8 hướng và 5 quy mô khác nhau để tạo ra 40 bộ lọc Gabor, cụ thể p € {0, ,7} và v e {0, ,4} Các thông số khác

thường được chọn như sau: Ø = 271; Kmạx = 1/2; ƒ= V2 Gọi I{z) là giá trị mức

xám tại điểm ảnh z, tích chập của I(z) với một bộ lọc Gabor ÝŸ,,,„ được xác định như công thức sau:

Ops=1@* Pay (2.5)

Một đặc trưng Gabor wavelet j được cầu hình bởi ba thông số quan trọng:

vị trí z, hướng ¡ và độ lớn v,được định nghĩa là:

Trang 29

Giá trị || ©u„„ || chính một đặc trưng Gabor tại vị trí z với hướng và quy mơ là p

và v Một vectơ đặc trưng Gabor đại diện cho tồn bộ bức ảnh I cĩ được Bằng cách ghép nổi theo dang tat cả các giá trị | ©ụx ||, Ðz € I, v € {0, ,4},u €{0, ,7}

Ta gọi G() là vectơ đặc trưng Gabor của ảnh I: G) = (|| oà | |Ì 00,1 [ll O07 Ill] 04,0 Ih Il ©4,7[)-

Hinh 2.8: Hình đáng của 40 bộ lọc Gabor [4]

Trang 30

Hình 2.9: (a) Phần thực của hạt nhân Gabor tại năm quy mô và tám định hưởng

6 = 2m, Kix = 7/2, va f= 21/2 (b) dé lớn của hạt nhân Gabor tại nam giá trị

khác nhau [4]

Trang 31

2.2 Cơ Sở Dữ Liệu Khuôn Mặt Người ( EACE DATABASE)

Có rất nhiều cơ sở dữ liệu khuôn mặt, sau đây là một số dữ liệu thông dụng

Có 3 cơ sở dữ liệu thường được dùng là:

e IMM Frontal Face Database: Duge sử dụng cho thử nghiệm ban đầu

Trang 32

«The AR database: Được sử dung cho một bài kiểm tra toàn diện của phương

pháp nhận dạng khuôn mặt MIDM (Multiple Individual Discriminative

Models)

© The XM2VTS database: Được sử dụng để đánh giá hiệu quả hoạt động của

Thuật toán MIDM

2.2.1 AR — Database

Cơ sở dữ liệu AR được ghi nhận vào năm 199% tai Trung tâm thị giác máy tính

(Computer Vision Center) frong Barcelona Cơ sa dit liga chứa các hình ảnh của

116 người, 7Ô ham và Ấ6 nữ, Mỗi người da được ghi lại tong hai lần (sessions),

mỗi lin bao goin 14 hink anh, ket qua co téng s6 3016 bink ank fai lan duce ghi lại hai tuần ngoài TẢ hình ảnh của mỗi lần chụp có nét mặt, ánh ác nhau

768 x Ã76 paxel Cát mộc chú thích dựa trên 22 điểm mốc chương

một số hình ảnh cua cơ sở dữ liệu AR

Cơ sở dừ liệu BiolD được ghi nhận vào năm 2001 BioID chứa 1521 binh ảnh của

23 người, khoảng 66 hình ảnh mỗi người Cơ sở dữ liệu được ghi lại trong một

số lượng không xác định các lần sử dụng một biến thể chiếu sang cao, biểu hiện

khuôn mặt và nền Mức độ biến đổi không được kiểm soát kết quả trong sự xuất

hiện hình ảnh cuộc sống "thực" Tắt cả hình ảnh của cơ sở đữ liệu BioID được ghi

lại trong màu xám với độ phân giải 384 x 286 pixel Điểm mốc chú thích dựa trên

20 điểm mốc chương trình có sẵn

2.2.3 BANCA

Đa cơ sở dữ liệu Banca được thu thập như một phần của dự án Banca châu Âu

Banca chứa các mẫu hình ảnh, mẫu video và các mẫu âm thanh Banca chứa các

hình ảnh của 52 người mỗi người được ghỉ nhận trong 12 lần mỗi bao gồm 10 hình

21

Trang 33

ảnh, kết quả là có tổng số 6240 hình ảnh Các lần được ghỉ nhận trong thời gian ba

tháng, tất cả hình ảnh được ghỉ lại là ảnh màu độ phân giải 720 x 576 pixel

2.2.4 IMM Face Database

Cơ sở dữ liệu khuôn mặt IMM duge ghi nhận vào năm 2001 tại Cục Tin hoc va Mô

Hình Toán Học - Đại học Kỹ thuật Đan Mạch Cơ sở dữ liệu chứa hình ảnh của 40

người, 33 nam và 7 nữ Nó đã được phi lại trong một lần và bao gồm 7 hình ảnh mỗi người do đó có tổng cộng 240 hình ảnh, 7 hình anh của mỗi người được chụp trong những nét mặt, ánh sang và camera divin anh (camera view point) khéc nhau,

Hau hét các hình anh được phí lạt trong ảnh máu tong khi phần còn lai được ghi lại

trong ảnh màu xám, FẤI cả đến có độ pháo giải 640 x 4860 diém anh Diệm mốc chú

thích đựa trên 48 dine wide luảng hình có sẵn,

2.2.5, MM Frantal Face Database

Cơ sở dữ liệu phía nước mật IMM được ghỉ nhận vào năm 2005 tai Cuc Tin hoc va

Mô Hình Toán Học - Đại học Kỹ thuật Đan Mạch Các cơ sở dir hứa các hình

ảnh của 13 người, tất cả là nam giới Cơ sở dữ liệu được ghi nhận trong zz2! lán và

bao gồm 10 hình ảnh của mỗi người do đó có tổng 120 hình ảnh 1Ú hinh ảnh của

mỗi người được chụp thuộc biểu hiện trên khuôn mặt khác nhau Tất cả hình ảnh được ghi lại trong ảnh màu với độ phân giải 2560 x 1920 pixel Diém moc chú thích

dựa trên 73 điểm mốc chương trình có sẵn

2.2.6 PIE

Cơ sở dữ liệu Tư thế, ánh sáng và nét mặt ( PIE) được ghỉ nhận vào năm 2000 tại

Đại học —_ Mellon 6 Pittsburgh Co sé dit liệu chứa các hình ảnh của 68

người ghỉ lại trong một lần Hơn 600 hình ảnh của mỗi người được đưa vào cơ xế

dữ liệu, kết quả có tổng số 41.368 hình ảnh Các hình ảnh được chụp dưới thay đổi nét mặt, camera điểm ảnh và ánh sáng Tất cả hình ảnh được ghi lại trong ảnh màu với độ phân giải 640 % 468 pixel

Trang 34

2.2.7.XM2VTS

Các đa cơ sở dữ liệu XM2VTS đã được ghi nhận tại Đại học Surrey Các cơ sở dữ

liệu chứa các hình ảnh, video và các mẫu âm thanh XM2VTS chứa các hình ảnh

của 295 người Mỗi người được ghi nhận trong 4 lần, mỗi lần bao gồm bốn hình ảnh

trên mỗi người, kết quả có tông số 4720 hình ảnh Các lần được ghi nhận trong thời

gian bốn tháng và được chụp ở phía trước và mặt nghiêng của khuôn mặt Tắt cả

hình ảnh được ghi lại trong ảnh màu với độ phân giải 720 < 576 pixel

2.3 Dùng Đặc Trưng Haar-like Trong Mô Hình Phân Tầng Tăng Cường

(BOOSTED CASCADES OF HAAR LIRE FEATURES)

231 ADAROOST (Adaptive Roostmg)

Trong một của số vàn hình ảnh 24 * 24 có hơn 160.000 đặc trum:

nhật], một số lượng lên hơn nhiều hơn so với số lượng điểm ảnh }

trưng có thể được tĩnh toàn rất hiệu quả nhờ ảnh tích hợp nhung tink

đầy đủ thì tên nhiều thời gian, Thách thức chính là tìm ra một s

trưng ma co thể kết hợp để tạo thành một phân loại hiệu quả Đề

tiêu này, các thuật toán học yếu được thiết kế để lựa chọn duy nhất đặc trưng hoặc

một số đặc trưng hình chữ nhật xuất hiện đồng thời mà tốt nhất ngăn cách các mẫu

(exambles) đương và âm

AdaBoost là một thuật toán học thống kê, nó hoạt động trên nguyên tắc kết hợp

tuyển tính các phân loại yếu (weak classifiers) đề hình thành một phân loại mạnh

(strong classifier) Với mỗi phân loại yếu sẽ quyết định kết quả cho một đặc trưng

hoặc một số đặc trưng Haar-like xuất hiện đồng thời (Joint Haar-like feature) bằng cách xác định ngưỡng với tỷ lệ lỗi nhỏ hơn 50

AdaBoost là một cải tiến của cách tiếp cận boosting được Freund và Schapire

đưa ra vào năm 1995 Trong quá trình huấn luyện AdaBoost sử dụng thêm khái niém trong sé (weight) để đánh dấu các mẫu khó nhận dạng, cứ mỗi weak classifiers duge x4y dựng, thuật toán sẽ tiến hành cập nhật lại trọng số để chuẩn bị cho việc xây dựng weak classifier kế tiếp: tăng trọng số của các mẫu bị nhận dạng,

23

Trang 35

sai và giảm trọng số của các mẫu được nhận đạng đúng bởi weak classifier vừa xây

dựng Bằng cách này weak classifer sau có thể tập trung vào các mẫu mà các weak

classifiers trước nó làm chưa tốt Sau cùng, các weak classifers sẽ được kết hợp tuyến tính lại để tao nén strong classifier

Một biến thể của AdaBoost là sử dụng cả hai: tập đặc trưng và tập huấn luyện của các mẫu ảnh đương và âm để chọn ra một tập đặc trưng nhỏ và đào tạo phân

loại được gọi là Cascade Of Classifiers Trong hình thức ban đầu của nó, AdaBoost

là thuật toán học được sử đụng đề thúc đầy (Boosting) hiệu suất phân loại của một

thuật toán học đơn giản (còn gọi là thuật toán học yêu),

Lịch sử của Hoosting bất nguồn từ câu hoi nội tiếng được đưa ra bơi Michale

Kearns vào năm 1089) “Lien võ te tạo ra một bộ phân lớp mạnh (12 classifier)

từ một tập cúc hà phản kaii về (veak classjfier ?”), Năm 1990, Robert Schapire

đưa ra thuật toàn boosting đầu tiên, Freund đã tiếp tục các nghiên cứu v2 đến nám

1995 thị ông cảng vài Schapire phat trién boosting thanh adaboost

Nguyên ly cử bản của boostng là sự kết hợp các weak cla en

strong classitier Trong do, céc weak classifiers chi can có độ chín

Khi kết hop ching lai chung ta cé mét strong classifier cé độ chính

vậy, chúng ta nói bộ phân loại đã được “boosting”

Để hiểu cách hoạt động của thuật toán boosting, chúng ta xét một bài toán phân loại 2 lớp (mẫu cần nhận dạng chỉ thuộc một trong hai lớp) với O Ja tap huấn luyện gồm có m mẫu Trước tiên, chúng ta sẽ chọn ngẫu nhiên ra mạ mẫu từ tập O (m¡<m) để tạo tập O Sau đó, chúng ta sẽ xây dựng weak classifier đầu tiên Lị từ

tập O¡ Tiếp theo, chúng ta xây dựng tập O; để huấn luyện bộ phân loại Lạ O; sẽ được xây dựng sao cho một nửa số mẫu của nó được phân loại đúng bởi Lị và nửa

còn lại bị phân loại sai bởi Lạ Bằng cách này, O; chứa đựng những thông tin bổ sung cho Lạ Bây giờ chúng ta sẽ xây huấn luyện Lạ từ Os

Tiếp theo, chúng ta sẽ xây dựng tập O¿ từ những mẫu không được phân loại

tốt bởi sự kết hợp giữa Li và Lạ: những mẫu còn lại trong O mà Lị và Lạ cho kết

quả khác nhau Như vay, O3 sé gồm những mẫu mà L¡ và Lạ hoạt động không hiệu

phân loại Lạ từ O3

Trang 36

'Bây giờ chúng ta đã có một strong classifier: sự kết hợp Lạ, Lạ và Lạ Khi tiến hành nhận dạng một mẫu X, kết quả sẽ được quyết định bởi sự thỏa thuận của 3 bộ

Lụ, Lạ và Lạ: Nếu cả Lị và Lạ đều phân X vào cùng một lớp thì lớp này chính là kết

quả phân loại của X; ngược lại, nếu Lị và L phân X vào 2 lớp khác nhau, C3 sẽ

quyết định X thuộc về lớp nào

Sau đây là ví dụ vé AdaBoost

Vi dy 2.1: AdaBoost Cho một tập gồm các mẫu dương (xanh) và mẫu âm (đỏ) như hình a Cac miu nay sẽ được đưa vào vòng lấp t= 1, ,T hình b Nếu tỉ lệ lỗi lớn hơn 0.5 thì thoát khởi vòng lần ngày tức khắc

Trang 37

e f(x) là giá trị đặc trưng Haar-like

« _ p là một chẵn lẽ để thay đổi dấu của bất đăng thức

© Ølàngưỡng

Ví dụ nếu ta dùng 3 đặc trưng Haar-like xuất hiện đồng thời: J = (101); = 5

> Thuật toán Adaboost dùng một đặc trưng Haar-like được mô tả như sau:

+ Cho tập n mẫu huấn luyện {Œ4, y\), (X2, ÿ›), (Xo, ya)}; Với xị c X (không

gian vector) và y; € {-1,+1} (14 phân loại); ¡ = 1, n

4 Khởi tạo phân trọng số ban đầu cho mỗi mẫu: D;(¡) = =

Đặt vòng lặp t= l, ,T

BI: Huấn luyện chọn weak classifier h,(x) với tỷ lệ lỗi €, nhỏ nhất trên Dr:

1 ÿƒp,#,(%)<P®, 1 #/Œœ)>9,

»60=|g gilernbé: Hay hŒœ) L #œ)<8 (2.8)

Trang 38

Trong đó: /; là giá trị đặc trưng Haar-like

p, là một chẵn lẽ để thay đổi dấu của bất đẳng thức

6, là ngưỡng sao cho tỷ lệ lỗi nhỏ nhất

B2: Tìm tỉ lệ lỗi: €, = DED, ma y; # hy(x;) ;— h= arg min €; ,

Uang sé chuẩn hóa Z¿ = 2/€¿ (1 — &,) (2.12)

4 BG phan lop mạnh được xây dựng;

Hộ) = siạn QJ-y œ;hị(3)) = sign(ahj@) +asha(6) + + abn) G13)

>_ Thuật toán Adaboost dùng nhiều đặc trưng xuất hiện đồng thời (Joint Haar-Ìike)

được mô tả như sau:

+ Cho tập n mẫu huấn luyện {Œ4, y¡), Œe, ÿ),.-., (Xe Ya)}; Với xị c X (không

gian vector) va y; € {-1,+1} (là phân loai); i= 1, n

+* Khởi tạo phân trọng số ban đầu cho mỗi mau: D, (i) = _

Trong đó: J, là giá trị đặc trưng Joint Haar-like

p, mét chẵn lẽ để thay đổi dầu của bất đẳng thức

27

Trang 39

9, là ngưỡng sao cho tỷ lệ lỗi nhỏ nhất B2: Tim ti lé 16i: €, = DL, D, (i) ma y; # A, (x;) ; > b= arg min €, ,

nếu €,> 5 thì kết thúc vòng lặp hiện tại (2.15)

1 B3: Tìm mức độ đóng góp của hự: a, = sim int >0 (2.16)

ee B4: Cập nhật trọng số

Din = AO ema: néu y= h(x)

Dei) = : e*+; nếu vị # h,(X,)

Trong đó:

Hing sd chadu hoa Z, = 2, f€; A> €) (2.18)

4 BO phan lop man duce say dmg:

H(x) = sign (XP , ay hy (4) = sien(aihi(X) †aaha(x) + + adQx)) (2.19)

Phần này mô tả một thuật toán để xây dựng một thác phân loại (Viola và Jones,

2001) đạt được tăng hiệu suất phát hiện cao trong khi triệt để giảm thời gian tính

toán Các bộ phân loại tăng cường được xây dựng để loại bô các cửa số con âm

(negative sub-windows) và phát hiện hầu thế các của số con dương (positive sub- windows) Các phân loại đơn giản được sử dụng để loại bỏ phân lớn các cửa số con

trước khi bộ phân loại phức tạp hơn được gọi ra để đạt được tỷ lệ dương tính giả thấp

Trang 40

Một thác phân loại là cây quyết định thoái hóa mà mỗi đoạn là một phân loại được huấn luyện để phát hiện hầu hết các đối tượng quan tâm trong khi từ chối một

phần nhất định các mô hình không phải đối tượng quan tâm Mỗi tầng được đào tạo

bằng cách sử dụng thuật toán AdaBoost

Có các phiên bản được sửa đổi của AdaBoost như Real-Boost, KLBoosting va

FloatBoost Hau hét các phương pháp này xây dựng một bộ phân loại yếu bằng cách

chọn một đặc trưng từ tập đặc trưng Tuy nhiên, hiệu suất tổng quát không còn được cải thiện trong vòng sau của qua trình tầng (boosUng process) bởi vì nhiệm vụ phân

loại chỉ sử dụng một đặc trưng trồ nén khó khan hơn, Viola va Jones cho biết đặc

trưng mà đã được lụa chọn trong các vòng sau đó máng lại Ú lệ lỗi khoang 0,4 đến

0,5 trong khi các đặc Hung đuạc lựa chọn vào vòng đầu có tỷ lệ lỗi giữz 6,1 va 0,3

hiểm suất

Như vậy quả nhiền phán loại yêu Không góp phần nâng cao tong

trong khi nó có thế lâm giam lỗi đảo tạo, Bat ky thuật toán thúc đây tizä ví náo cũng

sé phai dai mat vor van để nảy Dùng phương pháp đơn giản nhất, Jam tang số

lượng hình chữ nhật là khong khả thí bởi vì nó cần quá nhiễu thời gian cho việc

học, Đề giải quy ết vấn để này, đặc trưng joint Haar-like feature ding

khuôn mặt nó dựa trên xuất hiện đồng thời của nhiều đặc trưng Haar-like Đặc trưng

đồng thời xảy ra nắm bắt được đặc điểm của khuôn mặt của con người, làm cho nó

có thể để xây dựng một bộ phân loại mạnh hơn Các đặc trưng joint Haar-like có thê

được tính toán rất nhanh độc lập với độ phân giải hình ảnh và có chống lại tiếng ồn

và sự thay đổi ánh sáng mạnh mẽ

Sau đây là thuật toán thác phân loại:

% Đầu vào:

© _ Đưa một tập huấn luyện gồm P là những mẫu đương và N là những, mẫu âm

© Foor 18 tỷ lệ dương tính giả tổng thể tối đa có thể chấp nhận được của thác

phân loại Nếu có n tầng thì ta có Fmax = fmax

© f„„„ là tỷ lệ dương tính giả tối đa có thể chấp nhận được của mỗi ang (0.5)

29

Ngày đăng: 19/11/2024, 11:44

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w