Các Khái niệm và Thuật ngữ Cơ bản

Một phần của tài liệu Xây dựng hệ thống nhận dạng khuôn mặt sử dụng phương pháp học trực tuyến (Trang 20 - 24)

Trong lĩnh vực nhận dạng khuôn mặt, việc hiểu rõ các khái niệm và thuật ngữ cơ bản là rất quan trọng để nắm bắt cách thức hoạt động của hệ thống cũng như đánh giá hiệu suất của nó. Phần này sẽ giới thiệu các khái niệm chính, bao gồm sự khác biệt giữa khuôn mặt định danh và nhận diện khuôn mặt, các thành phần chính của hệ thống và các thước đo, tiêu chuẩn được sử dụng.

1.6.1 Khuôn mặt Định danh và Nhận diện Khuôn mặt

Trong ngữ cảnh của sinh trắc học và nhận dạng khuôn mặt, hai khái niệm khuôn mặt định danh (face verification)nhận diện khuôn mặt (face identification) thường được sử dụng, nhưng có sự khác biệt quan trọng về mục tiêu và ứng dụng.

Khuôn mặt Định danh (Face Verification)

Khuôn mặt định danh là quá trình xác minh danh tính của một người bằng cách so sánh khuôn mặt đầu vào với khuôn mặt đã biết trước đó. Đây là bài toánmột-một(one-to-one), tức là kiểm tra xem hai hình ảnh khuôn mặt có thuộc về cùng một người hay không. Ví dụ, khi mở khóa điện thoại bằng khuôn mặt, thiết bị sẽ so sánh khuôn mặt người dùng hiện tại với khuôn mặt đã đăng ký trước đó để xác minh danh tính.

Nhận diện Khuôn mặt (Face Identification)

Nhận diện khuôn mặt là quá trình xác định danh tính của một người bằng cách so sánh khuôn mặt đầu vào với một cơ sở dữ liệu chứa nhiều khuôn mặt. Đây là bài toán một- nhiều(one-to-many), nhằm tìm ra xem khuôn mặt đầu vào khớp với khuôn mặt nào trong cơ sở dữ liệu. Một ví dụ điển hình là hệ thống giám sát an ninh tại sân bay, nơi khuôn mặt của hành khách được so sánh với cơ sở dữ liệu tội phạm để phát hiện những cá nhân đáng ngờ.

So sánh giữa Định danh và Nhận diện

Sự khác biệt giữa khuôn mặt định danh và nhận diện khuôn mặt nằm ở mục tiêu, quy mô tìm kiếm, độ phức tạp và ứng dụng. Mục tiêu của định danh là xác minh danh tính được tuyên bố, trong khi nhận diện nhằm xác định danh tính chưa biết. Quy mô tìm kiếm trong định danh chỉ liên quan đến một mẫu duy nhất, còn trong nhận diện, khuôn mặt đầu vào được so sánh với nhiều mẫu trong cơ sở dữ liệu, dẫn đến độ phức tạp cao hơn.

Về ứng dụng, định danh thường được sử dụng trong mở khóa thiết bị, xác thực giao dịch, trong khi nhận diện được áp dụng trong giám sát an ninh, tìm kiếm người mất tích.

1.6.2 Các Thành phần Chính của Hệ thống

Một hệ thống nhận dạng khuôn mặt thường bao gồm các thành phần chính: phát hiện khuôn mặt, căn chỉnh và tiền xử lý, trích xuất đặc trưng, và so khớp và phân loại.

Phát hiện Khuôn mặt (Face Detection)

Đây là bước đầu tiên, nhằm xác định vị trí của khuôn mặt trong hình ảnh hoặc video.

Thuật toán phát hiện khuôn mặt phân biệt giữa khuôn mặt và các đối tượng khác trong ảnh. Các phương pháp phổ biến bao gồm sử dụng Haar Cascade với các đặc trưng Haar và thuật toán AdaBoost [48], HOG + SVM sử dụng đặc trưngHistogram of Ori- ented Gradientskết hợp với Support Vector Machine[12], và các mạng nơ-ron sâu như MTCNN [53].

Căn chỉnh và Tiền xử lý (Alignment and Preprocessing)

Sau khi phát hiện, khuôn mặt được căn chỉnh để chuẩn hóa về kích thước, góc nhìn và ánh sáng, giúp giảm thiểu ảnh hưởng của các biến đổi hình học và môi trường. Các kỹ thuật thường sử dụng bao gồm phát hiện điểm đặc trưng (facial landmarks) để xác định các điểm quan trọng trên khuôn mặt như mắt, mũi, miệng, và áp dụng biến đổi hình học như biến đổi affine để căn chỉnh khuôn mặt.

Trích xuất Đặc trưng (Feature Extraction)

Đây là bước quan trọng nhằm chuyển đổi hình ảnh khuôn mặt thành một vector đặc trưng số học, biểu diễn các thông tin quan trọng của khuôn mặt. Có hai phương pháp chính: sử dụng đặc trưng thủ công như PCA [45], LDA [9], LBP [1], SIFT [32]; và sử dụng đặc trưng học sâu thông qua các mô hình CNN để tự động học đặc trưng từ dữ liệu [43].

So khớp và Phân loại (Matching and Classification)

Bước này so sánh vector đặc trưng của khuôn mặt đầu vào với các vector trong cơ sở dữ liệu để xác định danh tính. Các kỹ thuật thường sử dụng bao gồm đo lường sự tương

đồng giữa các vector bằng khoảng cách Euclidean hoặc Cosine, và sử dụng các thuật toán phân loại như SVM, KNN, hoặc Softmax trong mạng nơ-ron.

Quản lý Cơ sở Dữ liệu (Database Management)

Cơ sở dữ liệu lưu trữ các vector đặc trưng của khuôn mặt, cùng với thông tin danh tính tương ứng. Việc quản lý cơ sở dữ liệu bao gồm thêm mới, cập nhật, và bảo mật dữ liệu.

1.6.3 Các Thước đo và Tiêu chuẩn

Để đánh giá hiệu suất hệ thống nhận dạng khuôn mặt, cần sử dụng các thước đo và tuân thủ những tiêu chuẩn nhất định. Trước hết,độ chính xác (Accuracy)được xác định bằng tỷ lệ số mẫu được nhận diện đúng so với tổng số mẫu:

Accuracy= Số mẫu đúng

Tổng số mẫu (1.1)

Tiếp theo, tỷ lệ nhận diện đúng (True Positive Rate, TPR) đánh giá khả năng nhận diện các mẫu dương tính:

TPR= TP

TP+FN (1.2)

Tỷ lệ báo động giả (False Positive Rate, FPR) phản ánh mức độ nhận diện sai các mẫu âm tính là dương tính:

FPR= FP

FP+TN (1.3)

Đường cong ROC (Receiver Operating Characteristic)trực quan hóa mối quan hệ giữa TPR và FPR, đồng thờiAUC (Area Under Curve) biểu thị khả năng phân biệt của hệ thống. Trong đó,TP (True Positive)là số mẫu dương tính được nhận diện đúng, TN (True Negative)là số mẫu âm tính được nhận diện đúng,FP (False Positive)là số mẫu âm tính bị nhận sai thành dương tính, vàFN (False Negative)là số mẫu dương tính bị nhận sai thành âm tính.

Ngoài các thước đo, việc tuân thủ các tiêu chuẩn và giao thức đánh giá giúp đảm bảo tính khách quan và khả năng so sánh công bằng giữa các hệ thống. Ví dụ,ISO/IEC 19795là tiêu chuẩn quốc tế đánh giá hiệu suất hệ thống sinh trắc học, LFW Protocol

(Labeled Faces in the Wild) sử dụng các cặp khuôn mặt để đánh giá định danh, và MegaFace Challengethử thách hệ thống trên bộ dữ liệu quy mô lớn.

Hiệu suất còn bị ảnh hưởng bởi nhiều yếu tố:chất lượng hình ảnh (độ phân giải, nhiễu, ánh sáng),biến đổi khuôn mặt (biểu cảm, góc nhìn, trang điểm, phụ kiện),quy mô và tính đa dạng cơ sở dữ liệu, cùng vớithuật toán sử dụng(độ phức tạp, khả năng tổng quát hóa).

Việc nắm rõ các khái niệm, thước đo, tiêu chuẩn và yếu tố ảnh hưởng này giúp thiết kế, cải tiến và đánh giá hệ thống nhận dạng khuôn mặt một cách hiệu quả, đáp ứng tốt nhu cầu trong nhiều lĩnh vực ứng dụng khác nhau.

Một phần của tài liệu Xây dựng hệ thống nhận dạng khuôn mặt sử dụng phương pháp học trực tuyến (Trang 20 - 24)

Tải bản đầy đủ (PDF)

(61 trang)