Khóa luận tốt nghiệp Khoa học máy tính: Một số hướng tiếp cho bài toán Low-Resolution Face Recognition

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề	Đánh giá một số hướng tiếp cận cho bài toán Low-Resolution Face Recognition
Tác giả	Chau Ngoc Huy, Phan Tien Ngoc
Người hướng dẫn	TS. Ngo Duc Thanh, ThS. Do Van Tien
Trường học	Đại học Quốc gia Thành phố Hồ Chí Minh
Chuyên ngành	Khoa học máy tính
Thể loại	Khóa luận tốt nghiệp
Năm xuất bản	2022
Thành phố	Thành phố Hồ Chí Minh

Định dạng
Số trang	62
Dung lượng	33,28 MB

Cấu trúc

1.3 Cấutrúckhóaluận (0)
- 2.1.1 Giới thiệu các khái niệm liên quan (14)
- 2.1.2 Cac bước của bài toán nhận diện khuôn mặt (0)
2.2 Bài toán nhận diện khuôn mặt ở độ phân giải thấp (17)
2.3 Các kiến thứccdSỞ ..............Ặ.ẶQẶ ẶẶ Q 9 (18)
- 2.3.1 Mạng nơ-ron tích chập (Convolutional Neural Network) 9 (0)
  - 2.3.1.1 Lớp tích chập (Convoluton) (18)
  - 2.3.1.2 Lép kích hoạt (Activaion) (0)
23.13 LópPoolng (0)
- 2.3.1.4 Lớp chuẩn hóa (Normalization) (24)
- 2.3.2 SuperResolulon..................Ặ.Ặ 16 (25)
- 2.3.3 Giảm độphângiải (26)
2.34 WGGNet ..........2. 000000222 eee 17 (0)
- 2.3.5 ResNet .. 2... 0.0... eee ee eee 19 (28)
- 2.3.6 Inception ............. . 0.000000 ee eee 21 Các hướng tiếp cận phổ biến cho bài toán nhận diện khuôn mặt ở độ phân giảthấp (30)
- 2.4.1 CoupledMappings (32)
- 2.4.2 SuperResolulon (32)
3.1 CoupleMappingsTCN (35)
- 3.1.1 Kiéntric .. 2.20... ee eee 27 (0)
- 3.1.2 Transferable Triple Loss (37)
- 3.1.3 Joint lramng...............Ặ.Ặ Ặ 29 (0)
3.2 Super Resolution .............. . Ặ Q Q HQ HS. 30 (39)
- 3.2.1 FaceNet........... va 30 “`3”... ...AAIÚ 31 3.2.3. Edge and Identity Preserving Network EIPNet (39)
  - 3.2.3.1 EdgeBlock (42)
  - 3.2.3.2 lIdentityLoss (0)
- 3.23.3 KiénTric (0)

Nội dung

1.1.2 Phạm vi Trong khuôn khổ giới hạn của khóa luận, nhóm thực hiện tập trung hoàn thành các công việc sau: ¢ Nhóm tập trung nghiên cứu tổng quan bài toán nhận diện khuôn mặt có độ phân

Cấutrúckhóaluận

Giới thiệu các khái niệm liên quan

Nhận diện khuôn mặt đã được nghiên cứu từ những năm 90 của thế kỷ trước. Suốt quá trình phát triển, nó đã và đang trở thành một lựa chọn khó thay thế trong việc nhận diện một người Cụ thể, bài toán này giúp chúng ta nhận diện được một người từ những hình ảnh khuôn mặt đã biết của họ Những hình ảnh cần nhận diện sẽ được gọi là probe, những hình ảnh đã biết sẽ được gọi là gallery. Dựa vào các nhu cầu và ứng dụng thực tế của bài toán, người ta chia bài toán

LRER làm 2 loại đó là xác thực khuôn mặt (face verification) và nhận diện khuôn mat (face identification). Đối với bài toán xác thực khuôn mặt, đây là một bài toán so sánh "một- một", nghĩa là ta phải so sánh 2 khuôn mặt có phải cùng một người hay không.

Kết quả trả ra của bài toán này dưới dạng nhị phân Nó được ứng dụng nhiều trong các hệ thống FacelD nhằm xác nhận khuôn mặt có phải chủ nhân chiếc điện thoại hay không? Còn bài toán nhận diện khuôn mặt, thì đây là bài toán

2 Bài toán nhận diện khuôn mặt ở độ phân giải thấp và các kiến thức liên quan

"một-nhiều" Cụ thể đối với bài toán này, ta phải xác định danh tính của khuôn mặt input dựa vào các danh tính đã được lưu trong tập gallery Kết quả trả ra là danh tính của người đó.

Hình 2.1: Phân loại bài toán face recognition

Ngoài ra, bài toán nhận diện khuôn mặt được chia làm 2 loại đó là close-set và open-set Đối với close-set, bài toán này sẽ dự đoán nhãn cho các probe dựa vào bộ khuôn mặt có trong gallery Nó sẽ phân biệt được hình ảnh đó có nằm trong gallery hay không Còn open-set, nó vẫn yêu cầu phải xác định được danh tính những người có trong bộ gallery Tuy nhiên, nó còn phải xác định được người đó có tổn tại trong bộ gallery hay không Một ứng dụng khá phổ biến cho trường hợp này là việc điểm danh trong công ty Hệ thống cần phải từ chối những người không thuộc công ty để đảm bảo được sự an toàn.

Mặt dù đã có một thời gian dài phát triển, nhưng bài toán ER đối diện với nhiều thách thức như chênh lệch tuổi, khuôn mặt bị che và độ phân giải thấp làm ảnh hưởng tới độ chính xác của hệ théng, Đó cũng là thách thức tổn tại trong

2 Bài toán nhận diện khuôn mặt ở độ phân giải thấp và các kiến thức liên quan bài toán LRFR.

2.1.2 Các bước của bài toán nhận diện khuôn mặt

Trong bài toán nhận diện khuôn mặt, input là một tấm ảnh có chứa khuôn mặt của người ta cần nhận diện Tùy theo từng ứng dụng cụ thể mà ta sẽ có những quy định khác nhau về tam ảnh input này Cụ thể, đối với bài toán nhận diện khuôn mặt ở độ phân giải thấp ta cho phép ảnh input có thể bao gồm nhiều

Hình 2.2: Quá trình nhận diện khuôn mat

Sau khi có được ảnh input, một mô hình phát hiện khuôn mặt được sử dụng để tìm kiếm và trích xuất các khuôn mặt từ bức ảnh Sau đó, chúng ta sẽ sử dụng một mô hình mạng neural để học cách trích xuất đặc trưng từ khuôn mặt và biểu diễn chúng dưới dạng các vector embedding Mô hình này thường được huấn luyện trên một cơ sở dữ liệu lớn chứa các ảnh khuôn mặt và vector embedding tương ứng.

Tiếp theo, để xác định danh tính của khuôn mặt, chúng ta có thể so sánh khoảng cách giữa vector embedding của khuôn mặt đó với các vector embedding trong cơ sở dữ liệu, và chọn vector embedding có khoảng cách gần nhất làm đại diện cho danh tính của khuôn mặt Hoặc sử dụng các mô hình học máy như

Support Vector Machine (SVM), k-Nearest Neighbors (KNN), hoặc Decision

Trees để phân loại khuôn mặt vào từng nhóm danh tính.

Mỗi phương pháp trên đều có ưu và nhược điểm khác nhau tùy thuộc vào yêu cầu và mục địch của bài toán để chúng ta chọn phương pháp cho phù hợp.

Bài toán nhận diện khuôn mặt ở độ phân giải thấp

Bài toán LRFR là một nhánh con của bài toán FR Tuy nhiên, bài toán nay ta cần nhận một tắm hình khuôn mặt ở độ phân giải thấp Vậy thế nào là một tắm ảnh có độ phân giải thấp? Hiện tại, chưa có một định nghĩa nào để xác định cho một tấm ảnh có độ phân giải thấp Tuy nhiên, dựa vào các bài nghiên cứu trước đó (Bảng 2.1) về bài toán này có thể thấy độ phân giải được dùng phổ biến trong khoảng từ 16x16 đến 32x32 pixels Ngoài ra đối với những hình ảnh khuôn mặt nhỏ hơn 16x16 pixels, việc xác định khuôn mặt sẽ rất khó đối với các phương pháp xác định khuôn mat hiện tai, còn những hình ảnh lớn hơn 32x32 pixels thì không đảm bảo được tính thách thức của bài toán Vì vậy, nhóm quyết định chọn độ phân giải (16x16

Ngày đăng: 23/10/2024, 09:16

Nguồn tham khảo

Tài liệu tham khảo	Loại	Chi tiết
[1] Omid Abdollahi Aghdam, Behzad Bozorgtabar, Hazim Kemal Ekenel, and Jean-Philippe Thiran. Exploring factors for improving low resolution face recognition. In 2079 IEEE/CVF Conference on Computer Vision and Pat- tern Recognition Workshops (CVPRW), pages 2363-2370. IEEE, 2019. 2	Khác
[2] John Canny. A computational approach to edge detection. JEEE Transac- tions on Pattern Analysis and Machine Intelligence, PAMI-8(6):679-698,1986. 34	Khác
[3] Qiong Cao, Li Shen, Weidi Xie, Omkar M Parkhi, and Andrew Zisserman.Vgứface2: A dataset for recognising faces across pose and age. In 20/8 13th IEEE international conference on automatic face & gesture recogni- tion (FG 2018), pages 67-74. IEEE, 2018. 2	Khác
[4] Zhiyi Cheng, Xiatian Zhu, and Shaogang Gong. Low-resolution face recognition. In Asian Conference on Computer Vision, pages 605-621.Springer, 2018. 3, 4, 8	Khác
[5] Jiankang Deng, Jia Guo, Niannan Xue, and Stefanos Zafeiriou. Arcface:Additive angular margin loss for deep face recognition. In Proceedings of the IEEE/CVF conference on computer vision and pattern recognition, pages 4690-4699, 2019. 2, 31	Khác
[6] Yandong Guo, Lei Zhang, Yuxiao Hu, Xiaodong He, and Jianfeng Gao.Ms-celeb-1m: A dataset and benchmark for large-scale face recognition. In European conference on computer vision, pages 87-102. Springer, 2016. 2	Khác
[7] Gary B Huang, Marwan Mattar, Tamara Berg, and Eric Learned-Miller.Labeled faces in the wild: A database forstudying face recognition in un- constrained environments. In Workshop on faces in’ Real-Life’ Images: de- tection, alignment, and recognition, 2008. 2, 3, 4, 30	Khác
[8] David H Hubel and Torsten N Wiesel. Receptive fields and func- tional architecture of monkey striate cortex. The Journal of physiology,195(1):215-243, 1968. 9	Khác
[9] Jonghyun Kim, Gen Li, Inyong Yun, Cheolkon Jung, and Joongkyu Kim.Edge and identity preserving network for face super-resolution. Neurocom- puting, 446:11—22, 2021. 3, 4	Khác
[10] Minchul Kim, Anil K Jain, and Xiaoming Liu. Adaface: Quality adaptive margin for face recognition. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, pages 18750-18759, 2022.2	Khác
[11] Brendan F Klare, Ben Klein, Emma Taborsky, Austin Blanton, Jordan Ch- eney, Kristen Allen, Patrick Grother, Alan Mah, and Anil K Jain. Pushing the frontiers of unconstrained face detection and recognition: larpa janus benchmark a. In Proceedings of the IEEE conference on computer vision and pattern recognition, pages 1931-1939, 2015. 2	Khác
[12] Pei Li, Loreto Prieto, Domingo Mery, and Patrick J Flynn. On low- resolution face recognition in the wild: Comparisons and new techniques	Khác