Mơ hình huấn luyện và kiểm tra SphereFace [9]

Một phần của tài liệu Nhận diện và theo dấu đối tượng trên hệ thống nhiều camera (Trang 35 - 36)

6 Tổng kết

2.17 Mơ hình huấn luyện và kiểm tra SphereFace [9]

hàm mất mát khác như Triplet Loss hay Center Loss. Sau khi SphereFace ra đời, kĩ thuật này được cải tiến rất nhiều, tiêu biểu là ArcFace: Additive Angular Margin Loss for Deep Face Recognition [10]đang xếp thứ hạng cao trong các phương pháp định danh đối tượng.

2.3.1.4 ArcFace: Additive Angular Margin Loss for Deep Face Recognition[10] [10]

Mặc dù SphereFace đạt kết quả tốt trên các tập dữ liệu, nhưng việc xấp xỉ nhiều trong quá trình huấn luyện và việc chọn tham số m là số ngun làm cho q trình tính mất mát rất cứng nhắc. Từ đó, việc mơ hình hội tụ rất khó khăn và có khả năng khơng hội tụ tốt được. Do đó, việc dựa trên ý tưởng Margin Loss của SphereFace, ArcFace ra đời để giải quyết vấn đề này. Những mặt tích cực của ArcFace có thể xem xét như sau:

Thu hút: ArcFace có thể tối ưu hóa mơ hình bằng cách dùng trực tiếp góc giữa vector.

Ảnh hưởng: ArcFace hoạt động tốt trên mười tập đo với ảnh và video.

Dễ dàng: ArcFace dễ dàng cài đặt trên các framework như Tensorflow4, Pytorch5. Mặt khác, phương pháp này không cần kết hợp các hàm mất mát khác để đạt tính ổn định trong lúc huấn luyện mà vẫn dễ dàng hội tụ.

Trước khi đi vào chi tiết bài báo, kiến trúc mơ hình tổng quát của Additive Angular Margin Loss for Deep Face Recognition [10] như hình 2.18.

Nhắc lại, cơng thức tính hàm mất mát của Softmax như cơng thức (2.11):

L1=−1 N N X i=1 log( eW T yixi WyiTxi WyiTxi+byi Pn j=1eWWWjjjTTTxixixi+bj) (2.11)

Trong đó, xiRd là vector đặc trưng thứ i thuộc lớp yi với d được cho là 512. WjRd

là cột thứ j của ma trậnWRdxnbjRn. Bằng cách chuẩn hóa||WT

j ||= 1 và ||xi|| bằng chuẩn L2 và chỉnh lại vector nhúng xi về thànhs. Khi đó, hàm mất mátL1 được viết lại như công thức (2.12):

L2=−1 N N X i=1 log( escos(θyi) escos(θyi)+PN j=1,j6=yiescos(θj)) (2.12)

Một phần của tài liệu Nhận diện và theo dấu đối tượng trên hệ thống nhiều camera (Trang 35 - 36)

Tải bản đầy đủ (PDF)

(95 trang)