CHƯƠNG 3: ỨNG DỤNG CÁC KỸ THUẬT TRONG NHẬN DẠNG KH- 123docz.net

KHUÔN MẶT

Có nhiều Cách để kết hợp các phương pháp nhận dạng khuôn mặt nhằm đạt hiệu quả cao, trong luận văn này tác giả xin được trình bày phương pháp phát hiện khuôn mặt (Viola Jone Face Detection), trích chọn đặc trưng (WLD), phân tích thành phần chính(PCA) và phân lớp (SVM).

Ảnh đưa vào nhận dạng, sau khi sử dụng Haar cascade để phát hiện và lấy ra khuôn mặt trong ảnh, sẽ tiến hành trích chọn đặc trưng sử dụng WLD và sử dụng PCA và sau đó sử dụng SVM để phânlớp/nhận dạng.

Hình 0.18 Mô hình sử dụng trong nhận dạng khuôn mặt

3.1. Phát hiện khuôn mặt (Viola Jone Face Detection)

Khi đưa vào một bức ảnh, trong đó có thể có một hoặc nhiều khuôn mặt, cũng có thể không có khuôn mặt nào trong ảnh. Do đó ta cần phải kiểm tra xem trong bức ảnh ta đưa vào có khuôn mặt hay không. Phát hiện khuôn mặt sẽ tách tất cả khuôn mặt trong ảnh. Có rất nhiều kỹ thuật khác nhau được sử dụng để phát hiện khuôn mặt như AdaBoost hay phân loại Haar cascade. Trong luận văn này sẽ sử dụng thuật toán Haar cascade có sẵn trong thư viện mở OpenCV.

Ảnh đưa vào sau khi đã được thực hiện tiền xử ly vẫn có số lượng thành phần ảnh lớn, do đó ta cần thực hiện trích rút đặc trƣng của ảnh, chỉ giữ lại những thành phần quan trọng nhất nhằm mục đích giảm độ lớn ảnh, tăng tốc độ xử ly của hệ thống. Sử dụng phương pháp WLD để thực hiện trích rút đặc trưng.

3.3. Phân tích thành phần chính PCA và nhận dạng/phân lớp SVM Phương pháp PCA:

Mục đích: Giảm chiều dữ liệu của tập vestor sao cho vẫn đảm bảo được tối đa thông tin quan trọng nhất. tức feature extration (giữ K thuộc tính mới) chứ không phải feature selection (giữ lại k thuộc tính nguyên gốc ban đầu).

Ý tưởng: thực hiện biến đổi trực giao để chọn các vector riêng có y nghĩa. Mỗi vector riêng này tương ứng với các giá trị riêng có y nghĩa nhất của tập dữ liệu. Mỗi vector đặc trưng sẽ được chiếu lên các vector này làm đặc trưng mới để phân lớp.

Việc Trích chọn số đặc trưng (eigenface)Chỉ giữ lại K vector lớn nhất bằng cách giữ lại các K vector đầu tiên (trong ma trận các vector đặc trưng) tương ứng với K trị riêng lơn nhất.

Hình 0.19 Mô hình quá trình tạo các đặc trưng mặt

- Biểu diễn các ảnh theo vector trị riêng vừa tìm đươc Các ảnh sẽ tương ứng với một vector trọng số mà mỗi hệ số của vector là hệ số tương ứng với một vector đặc trưng trong số các vector đặc trưng vừa tìm được. ta có thể biểu diễn như sau:

Hình 0.20 Ảnh ban đầu được biểu diễn theo các trọng số và eigenface (Nguồn: bài báo PCA)

Đầu vào của PCA là các vector cột có M thành phần biểu diễn ảnh trong tập huấn luyện, đầu ra là các vector cột có K thành phần biểu diễn ảnh đã được trích rút đặc trưng.

Phân lớp: Bước nhận dạng hay phân lớp tức là xác định danh tính (identity) hay nhãn của ảnh (label) – đó là ảnh của ai. Ở bước nhận dạng/phân lớp, ta sử

dụng phương pháp SVM (Support Vector Machine). SVM sẽ tiến hành phân lớp ảnh trong tập huấn luyện, khi đưa ảnh vào nhận dạng sẽ được so sánh, tìm ra ảnh đó thuộc vào lớp nào.

3.4. Mô tả dữ liệu

3.4.1. Thu nhập dữ liệu

Cơ sở dữ liệu ảnh được lấy 250 khuôn mặt từ được thu thập từ nhiều nguồn khác nhau. ảnh của 150 người đầu tiên được lấy từ trang quản ly cán bộ của một trường đại học. 50 người tiếp theo được lấy từ một hệ thống quản ly nhận sự: http://qlkh.mobifone.vn/b9_qlhs/login.xhtml. 50 ảnh tiếp theo được lấy từ hệ thống website:http://qlkh.mobifone.vn/b9_cskh/login.xhtml

Ngoài ra, còn có tập dữ liệu do chúng tôi tạo ra trong lúc thực hiện đề tài. Đó là dữ liệu được thu thập bằng WebCam gồm 5 người khác nhau. Chính sự chủ động trong việc tạo mẫu nên số lượng ảnh khoảng trên 11ảnh/1người.

Nhận xét về tập mẫu dữ liệu: Hầu hết các khuôn mặt xuất hiện trong ảnh là khuôn mặt trực diện với mặt phẳng ảnh và mỗi khuôn mặt đều đầy đủ thông tin

đặc trưng như {Hai chân mày, hai mắt, mũi, miệng, cằm}. 11 ảnh/1người ở các trạng thái khác nhau như( cưới, khóc, vui, buồn,…)

Kích thước chuẩn hoá của mỗi mẫu trong tập huấn luyện như mô tả trên Hình07. Tuỳ thuộc vào đặc trưng xử ly của mỗi thuật toán ta sử dụng một trong hai dạng kích thước ảnh chuẩn trên. Mỗi người có 11 ảnh được chụp ở các điều kiện ánh sáng và cảm xúc khác nhau.

Hình 0. 21 Ví dụ về ảnh của một người trong Yale face Database

Hình 0.23 Kích thước chuẩn hóa của một mẫu khuôn mặt trong học tập

3.4.2. Biểu diễn dữ liệu khuôn mặt trong máy tính

Dữ liệu ảnh biểu diễn bên trong máy tính là cường độ sáng của điểm ảnh, tại vị trị x và y: (I(x,y)). Để biểu diễn dữ liệu cho các thuật toán học nhận dạng, ta dùng hai cách tổ chức dữ liệu như sau:

 Đọc từng dòng ảnh theo thứ tự từ trên xuống, mỗi dòng ảnh được bố trí liên tục nhau trên một mảng số thực một chiều. Như vậy từ ảnh được biểu diễn thành mảng vector một chiều trong máy tính x=(x1,x2,….,x900).Đây là cách bố trí để thí nghiệm cho phương pháp PCA

 Đọc từng khối ảnh theo thứ tự khối dưới chồng lấp khối trên một nữa kích thước tính theo chiều cao, trên mỗi khối ảnh này ta lại tiếp tục tách ra mỗi khối con 8×8 liên tục nhau. Từ khối 8×8(pixels), chúng tôi chọn ra 20 hệ số đặc trưng từ phép biến đổi trên miền tần số. Mỗi khối ảnh 8×32 sẽ được lượng hoá thành mỗi vector một chiều. Như vậy đỗi với ảnh mỗi khuôn mặt ta biểu biển trong máy tính thành một chuỗi các vector một chiều liên tiếp nhau. Trong chương này của luận văn xây dựng chương trình giải quyết vấn đề sau:

- Đầu vào: là ảnh một khuôn mặt của một người nào đó đã được chuẩn hóa.

- Đầu ra: chương trình nhận dạng đưa ra ảnh và thông tin về người đó.

Tập dữ liệu được chia làm hai tập chính là tập luyện (training) và tập thử nghiệm (testing). Mỗi gương mặt đều xuất hiện năm lần trong mỗi tập với các tư thế khác nhau và góc chụp ảnh khác nhau.

a. Tập ảnh luyện (Training)

Hình 0.24 Một phần của tập ảnh luyện

b. Tập ảnh thử nghiệm (Testing)

Hình 0.25 Một phần của tập ảnh thử nghiệm

Xét về mặt kỹ thuật, các ảnh đều được chuẩn hóa về ảnh màu có cùng kích thước.

3.5. Kết quả thực nghiệm

Hệ thống sử dụng 200 ảnh từ các nguồn như sau: 150 ảnh được lấy từ trên mạng. 50 được lấy từ nguồn ảnh của các cán bộ trong cơ quan và chụp từ điện thoại. Đưa 50 thông tin của 200 ảnh được lấy từ 2 nguồn trên và thực nghiệm. kết quả thu được bảng sau:

Loại ảnh Nhận ra nhận Không

Không phải là mặt

Tổng số

Ảnh nằm trong tập huấn luyện

100 100 0 0

30 29 1 0

Khuôn mặt không nằm trong tập huấn luyện (khuôn mặt mới)

105 97 8 0

Ảnh bất kì không có khuôn mặt

50 0 0 15

Hình 0.26 Bảng 1.1. Bảng Thực nghiệm nhận dạng số lượng ảnh

Kết quả thực nghiệm nhận dạng khuôn mặt sử dụng phương pháp luận văn này đưa ra so với chỉ sử dụng PCA ta thấy được kết quả như sau:

Hình 0.27 kết quả thực nghiệm so với chỉ sử dụng PCA

Với bộ ảnh thực nghiệm, khi tập luấn luyện chỉ có ảnh duy nhất thì kết quả của phương phát PCA kém hơn phương pháp phát hiện khuôn mặt kết hợp cùng PCA – SVM.

CHƯƠNG 3: ỨNG DỤNG CÁC KỸ THUẬT TRONG NHẬN DẠNG KHUÔN MẶT