1.1.2 Phạm vi Trong khuôn khổ giới hạn của khóa luận, nhóm thực hiện tập trung hoàn thành các công việc sau: ¢ Nhóm tập trung nghiên cứu tổng quan bài toán nhận diện khuôn mặt có độ phân
Cấutrúckhóaluận
Giới thiệu các khái niệm liên quan
Nhận diện khuôn mặt đã được nghiên cứu từ những năm 90 của thế kỷ trước. Suốt quá trình phát triển, nó đã và đang trở thành một lựa chọn khó thay thế trong việc nhận diện một người Cụ thể, bài toán này giúp chúng ta nhận diện được một người từ những hình ảnh khuôn mặt đã biết của họ Những hình ảnh cần nhận diện sẽ được gọi là probe, những hình ảnh đã biết sẽ được gọi là gallery. Dựa vào các nhu cầu và ứng dụng thực tế của bài toán, người ta chia bài toán
LRER làm 2 loại đó là xác thực khuôn mặt (face verification) và nhận diện khuôn mat (face identification). Đối với bài toán xác thực khuôn mặt, đây là một bài toán so sánh "một- một", nghĩa là ta phải so sánh 2 khuôn mặt có phải cùng một người hay không.
Kết quả trả ra của bài toán này dưới dạng nhị phân Nó được ứng dụng nhiều trong các hệ thống FacelD nhằm xác nhận khuôn mặt có phải chủ nhân chiếc điện thoại hay không? Còn bài toán nhận diện khuôn mặt, thì đây là bài toán
2 Bài toán nhận diện khuôn mặt ở độ phân giải thấp và các kiến thức liên quan
"một-nhiều" Cụ thể đối với bài toán này, ta phải xác định danh tính của khuôn mặt input dựa vào các danh tính đã được lưu trong tập gallery Kết quả trả ra là danh tính của người đó.
Hình 2.1: Phân loại bài toán face recognition
Ngoài ra, bài toán nhận diện khuôn mặt được chia làm 2 loại đó là close-set và open-set Đối với close-set, bài toán này sẽ dự đoán nhãn cho các probe dựa vào bộ khuôn mặt có trong gallery Nó sẽ phân biệt được hình ảnh đó có nằm trong gallery hay không Còn open-set, nó vẫn yêu cầu phải xác định được danh tính những người có trong bộ gallery Tuy nhiên, nó còn phải xác định được người đó có tổn tại trong bộ gallery hay không Một ứng dụng khá phổ biến cho trường hợp này là việc điểm danh trong công ty Hệ thống cần phải từ chối những người không thuộc công ty để đảm bảo được sự an toàn.
Mặt dù đã có một thời gian dài phát triển, nhưng bài toán ER đối diện với nhiều thách thức như chênh lệch tuổi, khuôn mặt bị che và độ phân giải thấp làm ảnh hưởng tới độ chính xác của hệ théng, Đó cũng là thách thức tổn tại trong
2 Bài toán nhận diện khuôn mặt ở độ phân giải thấp và các kiến thức liên quan bài toán LRFR.
2.1.2 Các bước của bài toán nhận diện khuôn mặt
Trong bài toán nhận diện khuôn mặt, input là một tấm ảnh có chứa khuôn mặt của người ta cần nhận diện Tùy theo từng ứng dụng cụ thể mà ta sẽ có những quy định khác nhau về tam ảnh input này Cụ thể, đối với bài toán nhận diện khuôn mặt ở độ phân giải thấp ta cho phép ảnh input có thể bao gồm nhiều
Hình 2.2: Quá trình nhận diện khuôn mat
Sau khi có được ảnh input, một mô hình phát hiện khuôn mặt được sử dụng để tìm kiếm và trích xuất các khuôn mặt từ bức ảnh Sau đó, chúng ta sẽ sử dụng một mô hình mạng neural để học cách trích xuất đặc trưng từ khuôn mặt và biểu diễn chúng dưới dạng các vector embedding Mô hình này thường được huấn luyện trên một cơ sở dữ liệu lớn chứa các ảnh khuôn mặt và vector embedding tương ứng.
Tiếp theo, để xác định danh tính của khuôn mặt, chúng ta có thể so sánh khoảng cách giữa vector embedding của khuôn mặt đó với các vector embedding trong cơ sở dữ liệu, và chọn vector embedding có khoảng cách gần nhất làm đại diện cho danh tính của khuôn mặt Hoặc sử dụng các mô hình học máy như
Support Vector Machine (SVM), k-Nearest Neighbors (KNN), hoặc Decision
Trees để phân loại khuôn mặt vào từng nhóm danh tính.
Mỗi phương pháp trên đều có ưu và nhược điểm khác nhau tùy thuộc vào yêu cầu và mục địch của bài toán để chúng ta chọn phương pháp cho phù hợp.
Bài toán nhận diện khuôn mặt ở độ phân giải thấp
Bài toán LRFR là một nhánh con của bài toán FR Tuy nhiên, bài toán nay ta cần nhận một tắm hình khuôn mặt ở độ phân giải thấp Vậy thế nào là một tắm ảnh có độ phân giải thấp? Hiện tại, chưa có một định nghĩa nào để xác định cho một tấm ảnh có độ phân giải thấp Tuy nhiên, dựa vào các bài nghiên cứu trước đó (Bảng 2.1) về bài toán này có thể thấy độ phân giải được dùng phổ biến trong khoảng từ 16x16 đến 32x32 pixels Ngoài ra đối với những hình ảnh khuôn mặt nhỏ hơn 16x16 pixels, việc xác định khuôn mặt sẽ rất khó đối với các phương pháp xác định khuôn mat hiện tai, còn những hình ảnh lớn hơn 32x32 pixels thì không đảm bảo được tính thách thức của bài toán Vì vậy, nhóm quyết định chọn độ phân giải (16x16