Nhiệm vụ của quá trình này là tạo ra véc-tơ đặc tính mang những đặc tính riêng của khuôn mặt cần nhận dạng. Số chiều của véc-tơ đặc tính phải nhỏ hơn rất nhiều so với tín hiệu đầu vào. Trích xuất đặc trưng là một quá trình xử lý ảnh mà kết quả là một ma trận chứa các giá trị đặc trưng của hình ảnh, tùy vào trường hợp cụ thể mà sử dụng phương pháp trích xuất đặc trưng phù hợp.
Trong hệ thống nhận dạng khuôn mặt này, việc trích xuất giá trị đặc trưng được thực hiện bằng cách sử dụng một model mạng ResNet đã được đào tạo bởi Davis King – tác giả của thư viện mở Dlib[23]. Thông qua mạng ResNet các khuôn mặt sẽ được tính toán và trả về 128 giá trị đặc trưng cho từng khuôn mặt. Đây là mô hình có khả năng học từ một tập mẫu cho trước nhằm tự động phát hiện và trích chọn đặc trưng của khuôn mặt để thực hiện việc nhận dạng. Phương pháp này dựa trên việc học không gian Euclidean nhúng trong mỗi ảnh sử dụng cấu hình mạng nơ-ron chập. Mạng được huấn luyện sao cho khoảng cách các khuôn mặt cùng một người sẽ có khoảng cách nhỏ nhất và các khuôn mặt khác nhau sẽ có khoảng cách lớn nhất như Hình 2.11 được trình bày ở Chương 2
Sơ đồ quá trình của việc trích chọn đặc trưng
Hình 3.8: Sơ đồ quá trình trích chọn đặc trưng
Mạng được huấn luyện một cách trực tiếp để đầu ra của nó trở thành một véc-tơ đặc trưng 128 chiều sử dụng hàm chi phí bộ ba. Một bộ ba được định nghĩa bao gồm hai khuôn mặt của cùng một người và một khuôn mặt của người khác [19]. Mục tiêu của hàm chi phí là phân tách cặp khuôn mặt cùng một người ra khỏi khuôn mặt của người khác sử dụng một khoảng cách. Từ các kết quả đo thu được, thuật toán sẽ ước lượng giá
41
trị của hàm chi phi dựa trên việc so sánh khoáng cách giữa 2 tập đặc trưng, được sinh ra từ 2 ảnh khuôn mặt khác nhau của cùng một người được gọi là người thứ nhất và tập đặc trưng thứ 3 được sinh ra từ ảnh khuôn mặt của một người khác được gọi là người thứ hai. Các giá trị ước lượng của hàm chi phí sau khi tính sẽ được lan truyền ngược từ lớp cuối cùng đến lớp đầu tiên của mạng để tinh chỉnh trọng số tức cập nhật lại trọng số trên các lớp mạng. Quá trình tính toán, ước lượng và cập nhật trọng số của mạng được lặp đi lặp lại liên tục cho đến khi giá trị của hàm chi phí thỏa mãn điều kiện đã cho. Lặp lại các bước trên đối với toàn bộ tập dữ liệu huấn luyện cho đến khi thuật toán huấn luyện mạng hội tụ.
42