Phương pháp nhận điện khuôn mặt dùng kỹ thuật

Một phần của tài liệu Khóa luận tốt nghiệp Khoa học máy tính: Xây dựng hệ thống nhận diện khuôn mặt cho camera an ninh hỗ trợ cảnh báo xâm nhập và mở khóa cửa tự động (Trang 24 - 27)

NGHIÊN CỨU LIÊN QUAN

2. Cơ sở lý thuyết và các nghiên cứu liên quan

2.3 Phương pháp nhận điện khuôn mặt dùng kỹ thuật

học sâu (deep learning)

2.3.1 Giới thiệu

Với sự tiến bộ của phần cứng, các kỹ thuật deep learning dần chiếm ưu thé với độ chính xác cao hơn các kỹ thuật truyền thống. Sự khác biệt lớn nhất là việc trích xuất tính năng diễn ra tự động mà không yêu cầu các lớp tích chập được xác định trước. Điều này giúp các kỹ thuật deep learning giải quyết van dé ở phương diện tổng quát hơn và tránh sự phụ thuộc quá nhiều vào từng bộ dữ liệu riêng lẻ.

Có thể nói, ưu điểm lớn nhất của kỹ thuật deep learning là quá trình tự học để chọn ra những đặc điểm tốt nhất để phân loại và hiệu suất về độ chính xác vượt trội hơn rất nhiều so với các kỹ thuật truyền thống khác. Tuy nhiên, việc đào tạo các mô hình deep learning đòi hỏi một lượng dữ liệu lớn, rất tốn kém và cũng mat nhiều thời gian để đào tạo.

Quá trình đào tạo mô hình ER thường gồm hai bước chính:

ằ Tiền xử lý ảnh khuụn mặt (preprocessing): Trong bước này, ảnh khuụn mat

được chuẩn bị và tiền xử lý trước khi đưa vào mô hình để đảm bảo chất

11

2. Cơ sở lý thuyết và các nghiên cứu liên quan

lượng và độ chuẩn xác của dit liệu đào tạo.

¢ Huấn luyện mô hình (training): Sau khi tiền xử lý, dữ liệu đào tạo được

sử dụng để huấn luyện mô hình nhận dạng khuôn mặt. Mô hình học cách trích xuất các đặc trưng quan trọng từ ảnh khuôn mặt và xây dựng một biểu diễn học máy cho mỗi khuôn mặt.

Quá trình triển khai mô hình và quá trình nhận dạng gồm ba bước chính:

s Tiền xử lý ảnh khuôn mặt (preprocessing): Giống như trong quá trình dao

tạo, ảnh khuôn mặt cần được tiền xử lý trước khi đưa vào mô hình để đảm bảo tính nhất quán và chất lượng của dữ liệu thử nghiệm.

* Suy luận mô hình để lấy vectơ biểu diễn khuôn mặt (inference): Trong

bước này, mô hình được sử dụng để biến đổi ảnh khuôn mặt thành một vectơ biểu diễn số học, mô tả các đặc trưng quan trong của khuôn mặt đó.

ằ Nhận dang bằng cỏch so sỏnh đặc trưng giữa ảnh thử nghiệm và cỏc ảnh

có nhãn biết (recognition): Cuối cùng, quá trình nhận dang được thực hiện bằng cách so sánh vectơ biểu diễn của ảnh khuôn mặt thử nghiệm với các vectơ biểu diễn của các ảnh trong cơ sở dữ liệu có nhãn. Sự tương đồng giữa các vectơ này thường được đo bằng cosine similarity hoặc một phép

đo tương tự khác.

2.3.2 Hướng tiếp cận bài toán nhận diện khuôn mặt

Trong lĩnh vực nhận diện khuôn mặt sử dụng deep learning, chúng ta có thể

phân biệt hai phương pháp tiếp cận chính: "One-shot Learning" và "Learning

Similarity”.

One-shot Learning: Phương pháp này chủ yếu xử ly bài toán như một nhiệm

vụ phân loại (classification). Sử dụng kiến trúc mang CNN (Convolutional Neu-

ral Network) để phân loại, mô hình dự đoán danh tính của một người dựa trên

12

2. Cơ sở lý thuyết và các nghiên cứu liên quan

ảnh đầu vào. Tuy nhiên, một hạn chế đáng kể của phương pháp này là khi có sự xuất hiện của những người mới, ta cần phải huấn luyện lại toàn bộ mô hình để bao gồm những nhân dạng mới. Điều này là không khả thi trong các ứng dụng đòi hỏi sự linh hoạt cao như hệ thống chấm công hoặc an ninh.

Learning Similarity: Để giải quyết vấn đề trên, "Learning Similarity" là một phương pháp tiếp cận hiệu quả. Phương pháp này dựa trên nguyên tắc của các thuật toán phân cụm. Theo đó, nếu hai ảnh càng giống nhau (cùng một người),

khoảng cách giữa chúng trong không gian đặc trưng sẽ càng nhỏ. Khoảng cách

này có thể được đo lường bằng chuẩn L1 hoặc L2 (Euclidean distance). Một ngưỡng khoảng cách được xác định trước để so sánh ảnh đầu vào với các ảnh trong cơ sở dữ liệu. Nếu khoảng cách nằm dưới ngưỡng này, ảnh đó được xem

là khớp. Phương pháp này không phụ thuộc vào số lượng các lớp (classes) và không yêu cầu huấn luyện lại mô hình khi có sự xuất hiện của các lớp mới.

Siamese Network: Một yếu t6 quan trọng trong "Learning Similarity" là việc phát triển mô hình embedding hiệu quả. Siamese Network, sử dụng kiến

trúc CNN như Resnet, Inception, MobileNet nhưng loại bỏ lớp output, được

thiết kế để mã hóa (encode) ảnh thành vector embedding. Mạng này nhận đầu vào là hai ảnh bat kỳ, trả về hai vector biểu diễn cho hai ảnh đó. Sự khác biệt

giữa hai vector này được đánh giá thông qua ham loss function, đóng vai trò

quan trọng trong việc tối ưu mô hình để đạt được độ chính xác cao.

2.3.3 Ứng dung của bài toán nhận diện khuôn mặt

Bài toán nhận diện khuôn mặt là một trong những lĩnh vực quan trọng và có

nhiều ứng dụng hữu ích trong cuộc sống hàng ngày, công nghiệp và công việc:

* Bảo mật và Điều Khiển Truy Cập: Sử dụng trong các hệ thống bảo mật để

xác thực và kiểm soát truy cập.

ô Quản lý Sự Kiện: Dang ký và kiểm tra danh tớnh của người tham gia sự

13

2. Cơ sở lý thuyết và các nghiên cứu liên quan

kiện hoặc hội nghi.

¢ Giám sát an ninh công cộng: Theo dõi và xác định tội phạm hoặc nguy cơ

an ninh.

ằ Hỗ trợ thanh toỏn: Thanh toỏn bằng biểu thức khuụn mặt thay vỡ tiền mặt

hoặc thẻ tín dụng.

¢ Mở khóa điện Thoại di động: Sử dụng nhận diện khuôn mặt để mở khóa

thiết bị.

Trên đây là một số ứng dụng của nhận dạng khuôn mặt phổ biến, còn có thể áp dụng vào nhiều lĩnh vực khác nhau.

Một phần của tài liệu Khóa luận tốt nghiệp Khoa học máy tính: Xây dựng hệ thống nhận diện khuôn mặt cho camera an ninh hỗ trợ cảnh báo xâm nhập và mở khóa cửa tự động (Trang 24 - 27)

Tải bản đầy đủ (PDF)

(81 trang)