1. Trang chủ
  2. » Luận Văn - Báo Cáo

Khóa luận tốt nghiệp Khoa học máy tính: Một số hướng tiếp cho bài toán Low-Resolution Face Recognition

62 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Đánh giá một số hướng tiếp cận cho bài toán Low-Resolution Face Recognition
Tác giả Chau Ngoc Huy, Phan Tien Ngoc
Người hướng dẫn TS. Ngo Duc Thanh, ThS. Do Van Tien
Trường học Đại học Quốc gia Thành phố Hồ Chí Minh
Chuyên ngành Khoa học máy tính
Thể loại Khóa luận tốt nghiệp
Năm xuất bản 2022
Thành phố Thành phố Hồ Chí Minh
Định dạng
Số trang 62
Dung lượng 33,28 MB

Cấu trúc

  • 1.3 Cấutrúckhóaluận (0)
    • 2.1.1 Giới thiệu các khái niệm liên quan (14)
    • 2.1.2 Cac bước của bài toán nhận diện khuôn mặt (0)
  • 2.2 Bài toán nhận diện khuôn mặt ở độ phân giải thấp (17)
  • 2.3 Các kiến thứccdSỞ ..............Ặ.ẶQẶ ẶẶ Q 9 (18)
    • 2.3.1 Mạng nơ-ron tích chập (Convolutional Neural Network) 9 (0)
      • 2.3.1.1 Lớp tích chập (Convoluton) (18)
      • 2.3.1.2 Lép kích hoạt (Activaion) (0)
  • 23.13 LópPoolng (0)
    • 2.3.1.4 Lớp chuẩn hóa (Normalization) (24)
    • 2.3.2 SuperResolulon..................Ặ.Ặ 16 (25)
    • 2.3.3 Giảm độphângiải (26)
  • 2.34 WGGNet ..........2. 000000222 eee 17 (0)
    • 2.3.5 ResNet .. 2... 0.0... eee ee eee 19 (28)
    • 2.3.6 Inception ............. . 0.000000 ee eee 21 Các hướng tiếp cận phổ biến cho bài toán nhận diện khuôn mặt ở độ phân giảthấp (30)
    • 2.4.1 CoupledMappings (32)
    • 2.4.2 SuperResolulon (32)
  • 3.1 CoupleMappingsTCN (35)
    • 3.1.1 Kiéntric .. 2.20... ee eee 27 (0)
    • 3.1.2 Transferable Triple Loss (37)
    • 3.1.3 Joint lramng...............Ặ.Ặ Ặ 29 (0)
  • 3.2 Super Resolution .............. . Ặ Q Q HQ HS. 30 (39)
    • 3.2.1 FaceNet........... va 30 “`3”... ...AAIÚ 31 3.2.3. Edge and Identity Preserving Network EIPNet (39)
      • 3.2.3.1 EdgeBlock (42)
      • 3.2.3.2 lIdentityLoss (0)
    • 3.23.3 KiénTric (0)

Nội dung

1.1.2 Phạm vi Trong khuôn khổ giới hạn của khóa luận, nhóm thực hiện tập trung hoàn thành các công việc sau: ¢ Nhóm tập trung nghiên cứu tổng quan bài toán nhận diện khuôn mặt có độ phân

Cấutrúckhóaluận

Giới thiệu các khái niệm liên quan

Nhận diện khuôn mặt đã được nghiên cứu từ những năm 90 của thế kỷ trước. Suốt quá trình phát triển, nó đã và đang trở thành một lựa chọn khó thay thế trong việc nhận diện một người Cụ thể, bài toán này giúp chúng ta nhận diện được một người từ những hình ảnh khuôn mặt đã biết của họ Những hình ảnh cần nhận diện sẽ được gọi là probe, những hình ảnh đã biết sẽ được gọi là gallery. Dựa vào các nhu cầu và ứng dụng thực tế của bài toán, người ta chia bài toán

LRER làm 2 loại đó là xác thực khuôn mặt (face verification) và nhận diện khuôn mat (face identification). Đối với bài toán xác thực khuôn mặt, đây là một bài toán so sánh "một- một", nghĩa là ta phải so sánh 2 khuôn mặt có phải cùng một người hay không.

Kết quả trả ra của bài toán này dưới dạng nhị phân Nó được ứng dụng nhiều trong các hệ thống FacelD nhằm xác nhận khuôn mặt có phải chủ nhân chiếc điện thoại hay không? Còn bài toán nhận diện khuôn mặt, thì đây là bài toán

2 Bài toán nhận diện khuôn mặt ở độ phân giải thấp và các kiến thức liên quan

"một-nhiều" Cụ thể đối với bài toán này, ta phải xác định danh tính của khuôn mặt input dựa vào các danh tính đã được lưu trong tập gallery Kết quả trả ra là danh tính của người đó.

Hình 2.1: Phân loại bài toán face recognition

Ngoài ra, bài toán nhận diện khuôn mặt được chia làm 2 loại đó là close-set và open-set Đối với close-set, bài toán này sẽ dự đoán nhãn cho các probe dựa vào bộ khuôn mặt có trong gallery Nó sẽ phân biệt được hình ảnh đó có nằm trong gallery hay không Còn open-set, nó vẫn yêu cầu phải xác định được danh tính những người có trong bộ gallery Tuy nhiên, nó còn phải xác định được người đó có tổn tại trong bộ gallery hay không Một ứng dụng khá phổ biến cho trường hợp này là việc điểm danh trong công ty Hệ thống cần phải từ chối những người không thuộc công ty để đảm bảo được sự an toàn.

Mặt dù đã có một thời gian dài phát triển, nhưng bài toán ER đối diện với nhiều thách thức như chênh lệch tuổi, khuôn mặt bị che và độ phân giải thấp làm ảnh hưởng tới độ chính xác của hệ théng, Đó cũng là thách thức tổn tại trong

2 Bài toán nhận diện khuôn mặt ở độ phân giải thấp và các kiến thức liên quan bài toán LRFR.

2.1.2 Các bước của bài toán nhận diện khuôn mặt

Trong bài toán nhận diện khuôn mặt, input là một tấm ảnh có chứa khuôn mặt của người ta cần nhận diện Tùy theo từng ứng dụng cụ thể mà ta sẽ có những quy định khác nhau về tam ảnh input này Cụ thể, đối với bài toán nhận diện khuôn mặt ở độ phân giải thấp ta cho phép ảnh input có thể bao gồm nhiều

Hình 2.2: Quá trình nhận diện khuôn mat

Sau khi có được ảnh input, một mô hình phát hiện khuôn mặt được sử dụng để tìm kiếm và trích xuất các khuôn mặt từ bức ảnh Sau đó, chúng ta sẽ sử dụng một mô hình mạng neural để học cách trích xuất đặc trưng từ khuôn mặt và biểu diễn chúng dưới dạng các vector embedding Mô hình này thường được huấn luyện trên một cơ sở dữ liệu lớn chứa các ảnh khuôn mặt và vector embedding tương ứng.

Tiếp theo, để xác định danh tính của khuôn mặt, chúng ta có thể so sánh khoảng cách giữa vector embedding của khuôn mặt đó với các vector embedding trong cơ sở dữ liệu, và chọn vector embedding có khoảng cách gần nhất làm đại diện cho danh tính của khuôn mặt Hoặc sử dụng các mô hình học máy như

Support Vector Machine (SVM), k-Nearest Neighbors (KNN), hoặc Decision

Trees để phân loại khuôn mặt vào từng nhóm danh tính.

Mỗi phương pháp trên đều có ưu và nhược điểm khác nhau tùy thuộc vào yêu cầu và mục địch của bài toán để chúng ta chọn phương pháp cho phù hợp.

Bài toán nhận diện khuôn mặt ở độ phân giải thấp

Bài toán LRFR là một nhánh con của bài toán FR Tuy nhiên, bài toán nay ta cần nhận một tắm hình khuôn mặt ở độ phân giải thấp Vậy thế nào là một tắm ảnh có độ phân giải thấp? Hiện tại, chưa có một định nghĩa nào để xác định cho một tấm ảnh có độ phân giải thấp Tuy nhiên, dựa vào các bài nghiên cứu trước đó (Bảng 2.1) về bài toán này có thể thấy độ phân giải được dùng phổ biến trong khoảng từ 16x16 đến 32x32 pixels Ngoài ra đối với những hình ảnh khuôn mặt nhỏ hơn 16x16 pixels, việc xác định khuôn mặt sẽ rất khó đối với các phương pháp xác định khuôn mat hiện tai, còn những hình ảnh lớn hơn 32x32 pixels thì không đảm bảo được tính thách thức của bài toán Vì vậy, nhóm quyết định chọn độ phân giải (16x16

Ngày đăng: 23/10/2024, 09:16

HÌNH ẢNH LIÊN QUAN

Hình 2.1: Phân loại bài toán face recognition - Khóa luận tốt nghiệp Khoa học máy tính: Một số hướng tiếp cho bài toán Low-Resolution Face Recognition
Hình 2.1 Phân loại bài toán face recognition (Trang 15)
Hình 2.3: Minh họa phép tích chập - Khóa luận tốt nghiệp Khoa học máy tính: Một số hướng tiếp cho bài toán Low-Resolution Face Recognition
Hình 2.3 Minh họa phép tích chập (Trang 19)
Hình 2.5: Mô phỏng quá trình tích chập trong CNN (nguồn: medium!). - Khóa luận tốt nghiệp Khoa học máy tính: Một số hướng tiếp cho bài toán Low-Resolution Face Recognition
Hình 2.5 Mô phỏng quá trình tích chập trong CNN (nguồn: medium!) (Trang 21)
Hình 2.6: Ví dụ kết quả tính toán tích chập trong hình ảnh (nguồn: leonardoaraujosan- - Khóa luận tốt nghiệp Khoa học máy tính: Một số hướng tiếp cho bài toán Low-Resolution Face Recognition
Hình 2.6 Ví dụ kết quả tính toán tích chập trong hình ảnh (nguồn: leonardoaraujosan- (Trang 22)
Hình 2.7: Mô phỏng phép tính ReLU (Nguồn: educative!). - Khóa luận tốt nghiệp Khoa học máy tính: Một số hướng tiếp cho bài toán Low-Resolution Face Recognition
Hình 2.7 Mô phỏng phép tính ReLU (Nguồn: educative!) (Trang 23)
Hình 2.9: Minh họa áp dung Pooling từ lớp tích chập (nguồn: Internet!  ). - Khóa luận tốt nghiệp Khoa học máy tính: Một số hướng tiếp cho bài toán Low-Resolution Face Recognition
Hình 2.9 Minh họa áp dung Pooling từ lớp tích chập (nguồn: Internet! ) (Trang 25)
Hình 2.10: Kết quả một số phương pháp Super Resolution (nguồn: ResearchGate!). - Khóa luận tốt nghiệp Khoa học máy tính: Một số hướng tiếp cho bài toán Low-Resolution Face Recognition
Hình 2.10 Kết quả một số phương pháp Super Resolution (nguồn: ResearchGate!) (Trang 26)
Hình 2.14: Residual Block (nguồn: medium Ì) - Khóa luận tốt nghiệp Khoa học máy tính: Một số hướng tiếp cho bài toán Low-Resolution Face Recognition
Hình 2.14 Residual Block (nguồn: medium Ì) (Trang 29)
Hình 2.16: Inception Block - Khóa luận tốt nghiệp Khoa học máy tính: Một số hướng tiếp cho bài toán Low-Resolution Face Recognition
Hình 2.16 Inception Block (Trang 31)
Hình 2.17: Biểu diễn các hình anh LR va HR trong không gian. - Khóa luận tốt nghiệp Khoa học máy tính: Một số hướng tiếp cho bài toán Low-Resolution Face Recognition
Hình 2.17 Biểu diễn các hình anh LR va HR trong không gian (Trang 33)
Hình 3.7: Kiến trúc của edge block. r là hệ số scale tương ứng với nhiều mức độ khác - Khóa luận tốt nghiệp Khoa học máy tính: Một số hướng tiếp cho bài toán Low-Resolution Face Recognition
Hình 3.7 Kiến trúc của edge block. r là hệ số scale tương ứng với nhiều mức độ khác (Trang 43)
Hình 3.8: Mô tả ham identity loss. - Khóa luận tốt nghiệp Khoa học máy tính: Một số hướng tiếp cho bài toán Low-Resolution Face Recognition
Hình 3.8 Mô tả ham identity loss (Trang 45)
Hình 4.1: Một vài hình anh của bộ dữ liệu LFW - Khóa luận tốt nghiệp Khoa học máy tính: Một số hướng tiếp cho bài toán Low-Resolution Face Recognition
Hình 4.1 Một vài hình anh của bộ dữ liệu LFW (Trang 47)
Hình 4.5: Một vài kết quả khi tăng độ phân giải cho hình ảnh 20x20 pixels bằng phương - Khóa luận tốt nghiệp Khoa học máy tính: Một số hướng tiếp cho bài toán Low-Resolution Face Recognition
Hình 4.5 Một vài kết quả khi tăng độ phân giải cho hình ảnh 20x20 pixels bằng phương (Trang 52)
Hình 4.6: Một vài kết quả khi tăng độ phân giải bằng phương pháp ElPnet trên bộ dữ - Khóa luận tốt nghiệp Khoa học máy tính: Một số hướng tiếp cho bài toán Low-Resolution Face Recognition
Hình 4.6 Một vài kết quả khi tăng độ phân giải bằng phương pháp ElPnet trên bộ dữ (Trang 53)

TÀI LIỆU CÙNG NGƯỜI DÙNG

  • Đang cập nhật ...

TÀI LIỆU LIÊN QUAN