KHUÔN MẶT
Có nhiều Cách để kết hợp các phương pháp nhận dạng khuôn mặt nhằm đạt hiệu quả cao, trong luận văn này tác giả xin được trình bày phương pháp phát hiện khuôn mặt (Viola Jone Face Detection), trích chọn đặc trưng (WLD), phân tích thành phần chính(PCA) và phân lớp (SVM).
Ảnh đưa vào nhận dạng, sau khi sử dụng Haar cascade để phát hiện và lấy ra khuôn mặt trong ảnh, sẽ tiến hành trích chọn đặc trưng sử dụng WLD và sử dụng PCA và sau đó sử dụng SVM để phânlớp/nhận dạng.
Hình 0.18 Mô hình sử dụng trong nhận dạng khuôn mặt
3.1. Phát hiện khuôn mặt (Viola Jone Face Detection)
Khi đưa vào một bức ảnh, trong đó có thể có một hoặc nhiều khuôn mặt, cũng có thể không có khuôn mặt nào trong ảnh. Do đó ta cần phải kiểm tra xem trong bức ảnh ta đưa vào có khuôn mặt hay không. Phát hiện khuôn mặt sẽ tách tất cả khuôn mặt trong ảnh. Có rất nhiều kỹ thuật khác nhau được sử dụng để phát hiện khuôn mặt như AdaBoost hay phân loại Haar cascade. Trong luận văn này sẽ sử dụng thuật toán Haar cascade có sẵn trong thư viện mở OpenCV.
Ảnh đưa vào sau khi đã được thực hiện tiền xử ly vẫn có số lượng thành phần ảnh lớn, do đó ta cần thực hiện trích rút đặc trƣng của ảnh, chỉ giữ lại những thành phần quan trọng nhất nhằm mục đích giảm độ lớn ảnh, tăng tốc độ xử ly của hệ thống. Sử dụng phương pháp WLD để thực hiện trích rút đặc trưng.
3.3. Phân tích thành phần chính PCA và nhận dạng/phân lớp SVM Phương pháp PCA:
Mục đích: Giảm chiều dữ liệu của tập vestor sao cho vẫn đảm bảo được tối đa thông tin quan trọng nhất. tức feature extration (giữ K thuộc tính mới) chứ không phải feature selection (giữ lại k thuộc tính nguyên gốc ban đầu).
Ý tưởng: thực hiện biến đổi trực giao để chọn các vector riêng có y nghĩa. Mỗi vector riêng này tương ứng với các giá trị riêng có y nghĩa nhất của tập dữ liệu. Mỗi vector đặc trưng sẽ được chiếu lên các vector này làm đặc trưng mới để phân lớp.
Việc Trích chọn số đặc trưng (eigenface)Chỉ giữ lại K vector lớn nhất bằng cách giữ lại các K vector đầu tiên (trong ma trận các vector đặc trưng) tương ứng với K trị riêng lơn nhất.
Hình 0.19 Mô hình quá trình tạo các đặc trưng mặt
- Biểu diễn các ảnh theo vector trị riêng vừa tìm đươc Các ảnh sẽ tương ứng với một vector trọng số mà mỗi hệ số của vector là hệ số tương ứng với một vector đặc trưng trong số các vector đặc trưng vừa tìm được. ta có thể biểu diễn như sau:
Hình 0.20 Ảnh ban đầu được biểu diễn theo các trọng số và eigenface (Nguồn: bài báo PCA)
Đầu vào của PCA là các vector cột có M thành phần biểu diễn ảnh trong tập huấn luyện, đầu ra là các vector cột có K thành phần biểu diễn ảnh đã được trích rút đặc trưng.
Phân lớp: Bước nhận dạng hay phân lớp tức là xác định danh tính (identity) hay nhãn của ảnh (label) – đó là ảnh của ai. Ở bước nhận dạng/phân lớp, ta sử
dụng phương pháp SVM (Support Vector Machine). SVM sẽ tiến hành phân lớp ảnh trong tập huấn luyện, khi đưa ảnh vào nhận dạng sẽ được so sánh, tìm ra ảnh đó thuộc vào lớp nào.
3.4. Mô tả dữ liệu
3.4.1. Thu nhập dữ liệu
Cơ sở dữ liệu ảnh được lấy 250 khuôn mặt từ được thu thập từ nhiều nguồn khác nhau. ảnh của 150 người đầu tiên được lấy từ trang quản ly cán bộ của một trường đại học. 50 người tiếp theo được lấy từ một hệ thống quản ly nhận sự: http://qlkh.mobifone.vn/b9_qlhs/login.xhtml. 50 ảnh tiếp theo được lấy từ hệ thống website:http://qlkh.mobifone.vn/b9_cskh/login.xhtml
Ngoài ra, còn có tập dữ liệu do chúng tôi tạo ra trong lúc thực hiện đề tài. Đó là dữ liệu được thu thập bằng WebCam gồm 5 người khác nhau. Chính sự chủ động trong việc tạo mẫu nên số lượng ảnh khoảng trên 11ảnh/1người.
Nhận xét về tập mẫu dữ liệu: Hầu hết các khuôn mặt xuất hiện trong ảnh là khuôn mặt trực diện với mặt phẳng ảnh và mỗi khuôn mặt đều đầy đủ thông tin
đặc trưng như {Hai chân mày, hai mắt, mũi, miệng, cằm}. 11 ảnh/1người ở các trạng thái khác nhau như( cưới, khóc, vui, buồn,…)
Kích thước chuẩn hoá của mỗi mẫu trong tập huấn luyện như mô tả trên Hình07. Tuỳ thuộc vào đặc trưng xử ly của mỗi thuật toán ta sử dụng một trong hai dạng kích thước ảnh chuẩn trên. Mỗi người có 11 ảnh được chụp ở các điều kiện ánh sáng và cảm xúc khác nhau.
Hình 0. 21 Ví dụ về ảnh của một người trong Yale face Database
Hình 0.23 Kích thước chuẩn hóa của một mẫu khuôn mặt trong học tập
3.4.2. Biểu diễn dữ liệu khuôn mặt trong máy tính
Dữ liệu ảnh biểu diễn bên trong máy tính là cường độ sáng của điểm ảnh, tại vị trị x và y: (I(x,y)). Để biểu diễn dữ liệu cho các thuật toán học nhận dạng, ta dùng hai cách tổ chức dữ liệu như sau:
Đọc từng dòng ảnh theo thứ tự từ trên xuống, mỗi dòng ảnh được bố trí liên tục nhau trên một mảng số thực một chiều. Như vậy từ ảnh được biểu diễn thành mảng vector một chiều trong máy tính x=(x1,x2,….,x900).Đây là cách bố trí để thí nghiệm cho phương pháp PCA
Đọc từng khối ảnh theo thứ tự khối dưới chồng lấp khối trên một nữa kích thước tính theo chiều cao, trên mỗi khối ảnh này ta lại tiếp tục tách ra mỗi khối con 8×8 liên tục nhau. Từ khối 8×8(pixels), chúng tôi chọn ra 20 hệ số đặc trưng từ phép biến đổi trên miền tần số. Mỗi khối ảnh 8×32 sẽ được lượng hoá thành mỗi vector một chiều. Như vậy đỗi với ảnh mỗi khuôn mặt ta biểu biển trong máy tính thành một chuỗi các vector một chiều liên tiếp nhau. Trong chương này của luận văn xây dựng chương trình giải quyết vấn đề sau:
- Đầu vào: là ảnh một khuôn mặt của một người nào đó đã được chuẩn hóa.
- Đầu ra: chương trình nhận dạng đưa ra ảnh và thông tin về người đó.
Tập dữ liệu được chia làm hai tập chính là tập luyện (training) và tập thử nghiệm (testing). Mỗi gương mặt đều xuất hiện năm lần trong mỗi tập với các tư thế khác nhau và góc chụp ảnh khác nhau.
a. Tập ảnh luyện (Training)
Hình 0.24 Một phần của tập ảnh luyện
b. Tập ảnh thử nghiệm (Testing)
Hình 0.25 Một phần của tập ảnh thử nghiệm
Xét về mặt kỹ thuật, các ảnh đều được chuẩn hóa về ảnh màu có cùng kích thước.
3.5. Kết quả thực nghiệm
Hệ thống sử dụng 200 ảnh từ các nguồn như sau: 150 ảnh được lấy từ trên mạng. 50 được lấy từ nguồn ảnh của các cán bộ trong cơ quan và chụp từ điện thoại. Đưa 50 thông tin của 200 ảnh được lấy từ 2 nguồn trên và thực nghiệm. kết quả thu được bảng sau:
Loại ảnh Nhận ra nhận Không
ra
Không phải là mặt
Tổng số
Ảnh nằm trong tập huấn luyện
100 100 0 0
30 29 1 0
Khuôn mặt không nằm trong tập huấn luyện (khuôn mặt mới)
105 97 8 0
Ảnh bất kì không có khuôn mặt
50 0 0 15
Hình 0.26 Bảng 1.1. Bảng Thực nghiệm nhận dạng số lượng ảnh
Kết quả thực nghiệm nhận dạng khuôn mặt sử dụng phương pháp luận văn này đưa ra so với chỉ sử dụng PCA ta thấy được kết quả như sau:
Hình 0.27 kết quả thực nghiệm so với chỉ sử dụng PCA
Với bộ ảnh thực nghiệm, khi tập luấn luyện chỉ có ảnh duy nhất thì kết quả của phương phát PCA kém hơn phương pháp phát hiện khuôn mặt kết hợp cùng PCA – SVM.