CHƯƠNG 3: ỨNG DỤNG CÁC KỸ THUẬT TRONG NHẬN DẠNG
3.3. Phân tích thành phần chính PCA và nhận dạng/phân lớp SVM Phương pháp PCA
Mục đích: Giảm chi u dữ liệu của tập vestor sao cho vẫn ảm bảo ược tối a thông tin quan trọng nhất. tức feature extration (giữ K thuộc tính mới) chứ không phải feature selection (giữ lại k thuộc tính nguyên gốc ban ầu).
Ý tưởng: th c hiện biến ổi tr c giao ể chọn các vector riêng có nghĩa. Mỗi vector riêng này tương ứng với các giá trị riêng có nghĩa nhất của tập dữ liệu.
Mỗi vector ặc trưng sẽ ược chiếu lên các vector này làm ặc trưng mới ể ph n lớp.
Việc Trích chọn số ặc trưng (eigenface)Chỉ giữ lại K vector lớn nhất bằng cách giữ lại các K vector ầu tiên (trong ma trận các vector ặc trưng) tương ứng với K trị riêng lơn nhất.
Hình 0.19 Mô hình quá trình tạo các đặc trƣng mặt
- Biểu diễn các ảnh theo vector trị riêng vừa tìm ươc Các ảnh sẽ tương ứng với một vector trọng số mà mỗi hệ số của vector là hệ số tương ứng với một vector ặc trưng trong số các vector ặc trưng vừa tìm ược.
Hình 0.20 Ảnh ban đầu đƣợc biểu diễn theo các trọng số và eigenface (Nguồn: bài báo PCA)
Đầu vào của PCA là các vector cột có M thành phần biểu diễn ảnh trong tập huấn luyện, ầu ra là các vector cột có K thành phần biểu diễn ảnh ã ược trích rút ặc trưng.
Ph n lớp: ước nhận dạng hay ph n lớp tức là xác ịnh danh tính (identity) hay nhãn của ảnh (label) – ó là ảnh của ai. Ở bước nhận dạng/ph n lớp, ta sử
d ng phương pháp SVM (Support Vector Machine). SVM sẽ tiến hành ph n lớp ảnh trong tập huấn luyện, khi ưa ảnh vào nhận dạng sẽ ược so sánh, tìm ra ảnh ó thuộc vào lớp nào.
3.4. Mô tả dữ liệu 3.4.1. Thu nhập dữ liệu
Cơ sở dữ liệu ảnh ược lấy 250 khuôn mặt từ ược thu thập từ nhi u nguồn khác nhau. ảnh của 150 người ầu tiên ược lấy từ trang quản l cán bộ của một trường ại học. 50 người tiếp theo ược lấy từ một hệ thống quản l nhận s : http://qlkh.mobifone.vn/b9_qlhs/login.xhtml. 50 ảnh tiếp theo ược lấy từ hệ thống website:http://qlkh.mobifone.vn/b9_cskh/login.xhtml
Ngoài ra, còn có tập dữ liệu do chúng tôi tạo ra trong lúc th c hiện tài.
Đó là dữ liệu ược thu thập bằng WebCam gồm 5 người khác nhau. Chính s chủ ộng trong việc tạo mẫu nên số lượng ảnh khoảng trên 11ảnh/1người.
Nhận xét về tập mẫu dữ liệu: Hầu hết các khuôn mặt xuất hiện trong ảnh là khuôn mặt tr c diện với mặt phẳng ảnh và mỗi khuôn mặt u ầy ủ thông tin
ặc trưng như {Hai ch n mày, hai mắt, mũi, miệng, cằm}. 11 ảnh/1người ở các trạng thái khác nhau như( cưới, khóc, vui, buồn,…)
Kích thước chuẩn hoá của mỗi mẫu trong tập huấn luyện như mô tả trên Hình07. Tuỳ thuộc vào ặc trưng xử l của mỗi thuật toán ta sử d ng một trong hai dạng kích thước ảnh chuẩn trên. Mỗi người có 11 ảnh ược ch p ở các i u kiện ánh sáng và cảm xúc khác nhau.
Hình 0. 21 Ví dụ về ảnh của một người trong Yale face Database
Hình 0.22 Ảnh 12 khuôn mặt người được đánh thứ tự từ 1 đến 12
Hình 0.23 Kích thước chuẩn hóa của một mẫu khuôn mặt trong học tập
3.4.2. Biểu diễn dữ liệu khuôn mặt trong máy tính
Dữ liệu ảnh biểu diễn bên trong máy tính là cường ộ sáng của iểm ảnh, tại vị trị x và y: (I(x,y)). Để biểu diễn dữ liệu cho các thuật toán học nhận dạng, ta dùng hai cách tổ chức dữ liệu như sau:
Đọc từng dòng ảnh theo thứ t từ trên xuống, mỗi dòng ảnh ược bố trí liên t c nhau trên một mảng số th c một chi u. Như vậy từ ảnh ược biểu diễn thành mảng vector một chi u trong máy tính x=(x1,x2,….,x900).Đ y là cách bố trí ể thí nghiệm cho phương pháp PCA
Đọc từng khối ảnh theo thứ t khối dưới chồng lấp khối trên một nữa kích thước tính theo chi u cao, trên mỗi khối ảnh này ta lại tiếp t c tách ra mỗi khối con 8×8 liên t c nhau. Từ khối 8×8(pixels), chúng tôi chọn ra 20 hệ số ặc trưng từ phép biến ổi trên mi n tần số. Mỗi khối ảnh 8×32 sẽ ược lượng hoá thành mỗi vector một chi u. Như vậy ỗi với ảnh mỗi khuôn mặt ta biểu biển trong máy tính thành một chuỗi các vector một chi u liên tiếp nhau. Trong chương này của luận văn x y d ng chương trình giải quyết vấn sau:
- Đầu vào: là ảnh một khuôn mặt của một người nào ó ã ược chuẩn hóa.
- Đầu ra: chương trình nhận dạng ưa ra ảnh và thông tin v người ó.
3.4.3. Dữ liệu huấn luyện
Tập dữ liệu ược chia làm hai tập chính là tập luyện (training) và tập thử nghiệm (testing). Mỗi gương mặt u xuất hiện năm lần trong mỗi tập với các tư thế khác nhau và góc ch p ảnh khác nhau.
a. Tập ảnh luyện (Training)
Hình 0.24 Một phần của tập ảnh luyện
b. Tập ảnh thử nghiệm (Testing)
Hình 0.25 Một phần của tập ảnh thử nghiệm
Xét v mặt kỹ thuật, các ảnh u ược chuẩn hóa v ảnh màu có cùng kích thước.