.11 Kết quả đầu ra của O-Net

Một phần của tài liệu Xây dựng ứng dụng hỗ trợ điểm danh sinh viên bằng điện thoại dựa trên nhận dạng khuôn mặt người luận văn thạc sĩ công nghệ thông tin (Trang 62 - 64)

4.3 Nhận dạng khuôn mặt bằng ArcFace Model4.3.1 Giới thiệu. 4.3.1 Giới thiệu.

Biểu diễn khn mặt bằng cách sử dụng nhúng Mạng neuron tích chập sâu (DCNN) là phƣơng pháp đƣợc lựa chọn cho nhận dạng khn mặt. Các DCNN ánh xạ hình ảnh khn mặt, thƣờng là sau bƣớc chuẩn hóa tƣ thế, thành một tính năng có khoảng cách giữa các lớp nhỏ và khoảng cách giữa các lớp lớn. Có hai dịng

nghiên cứu chính để đào tạo DCNN cho nhận dạng khn mặt. Những hệ thống huấn luyện một trình phân loại nhiều lớp có thể phân tách các danh tính khác nhau trong tập huấn luyện, chẳng hạn nhƣ bằng cách sử dụng trình phân loại softmax và những ngƣời học trực tiếp nhúng, chẳng hạn nhƣ Soft-max loss. Dựa trên dữ liệu đào tạo quy mô lớn và các kiến trúc DCNN phức tạp, cả phƣơng pháp dựa trên Soft- max loss và phƣơng pháp dựa trên triplet-loss có thể đạt đƣợc hiệu suất tuyệt vời về nhận dạng khuôn mặt.Tuy nhiên, cả Softmax loss và Triplet-loss đều có một số nhƣợc điểm

Đối với softmax loss (1) Kích thƣớc của ma trận biến đổi tuyến tính

W ∈ Rdxn tăng tuyến tính với số nhận dạng n; (2) Các tính năng đã học có thể tách rời cho vấn đề phân loại đóng nhƣng khơng đủ phân biệt đối với vấn đề nhận dạng khuôn mặt mở.

Đối với Triplet Loss (1) Có một vụ nổ tổ hợp trong số lƣợng bộ ba khuôn

mặt đặc biệt là đối với các bộ dữ liệu quy mô lớn, dẫn đến sự gia tăng đáng kể số lƣợng các bƣớc lặp; (2) Khai thác mẫu semi-hard là một vấn đề khá khó khăn để đào tạo mơ hình hiệu quả.

Đã có một số biến thể đƣợc đề xuất để tăng cƣờng khả năng phân biệt của Softmax loss. Đầu tiên là Centre loss, phƣơng pháp này sử dụng khoảng cách Euclide giữa mỗi vector đặc trƣng và tâm của lớp đó để có đƣợc sự gọn nhẹ trong mỗi lớp mà vẫn đảm bảo sự phân tán trong trong mỗi lớp bằng Softmax loss. Tuy nhiên, việc cập nhật các tâm trong quá trình huấn luyện trên thực thế rất khó khăn. Bởi số lƣợng khn mặt huấn luyện rất lớn và liên tục tăng.

Ta có thể thấy trọng số từ lớp kết nối đầy đủ cuối cùng của phân lớp DCNN đƣợc huấn luyện trên hàm Softmax loss mang sự tƣơng đồng với các tâm của mỗi lớp. Do đó, xử lý biên góc nhân (multicative angular margin penalty) đƣợc đề xuất để thực thi đồng thời sự nhỏ gọn trong mỗi lớp và sự khác biệt giữa các lớp, dẫn tới khả năng phân biệt tốt hơn cho model đƣợc huấn luyện. Mặc dù Sphereface đã giới thiệu ý tƣởng quan trọng này của biên góc (angular marrgin), nhƣng hàm này địi hỏi một loạt các sấp xỉ để đƣợc tính tốn, dẫn đến việc huấn luyện mạng khơng ổn định. Để q trình huấn luyện ổn định, một hàm mất mát lai (hybrid loss) đƣợc đề xuất, nó bao gồm các tiêu chuẩn của Softmax loss. Theo các nghiên cứu, softmax

loss chi phối q trình huấn luyện bởi vì biên góc nhân dựa vào một số nguyên làm đƣờng cong logit mục tiêu rất dốc và cản trở sự đồng quy (hội tụ). CosFace cộng thêm trực tiếp các biên cosin vào logit mục tiêu, nó đạt đƣợc hiệu suất tốt hơn so với SphereFace nhƣng thừa nhận việc thực hiện dễ dàng hơn nhiều và giảm nhu cầu giám sát chung từ Softmax loss.

Do đó, tơi đã nghiên cứu và sử dụng ArcFace để cải thiện hơn nữa khả năng phân biệt của mơ hình nhận dạng khn mặt và để ổn định q trình huấn luyện.

Một phần của tài liệu Xây dựng ứng dụng hỗ trợ điểm danh sinh viên bằng điện thoại dựa trên nhận dạng khuôn mặt người luận văn thạc sĩ công nghệ thông tin (Trang 62 - 64)