30
Hình 29: Kết quả chạy chương trình
Hình 30: Kết quả được lưu lại
Đánh giá kết quả:
HOG:
Điểm mạnh:
- Hoạt động tốt khi hình ảnh có kích thước lớn và có ánh sáng tốt, bắt chuyển động mượt mà, ổn định với thời gian thực thi ngắn trong điều kiện ít đối tượng.
- Phù hợp với các ứng dụng yêu cầu độ chính xác cao và có thể xử lý các điều kiện tốt như giám sát an ninh trong các môi trường ổn định hoặc các ứng dụng đòi hỏi phát hiện khuôn mặt rõ ràng.
Điểm yếu:
- Gặp khó khăn với các tình huống như khi khuôn mặt có góc nghiêng, ánh sáng kém, hoặc khi khuôn mặt bị che một phần. Đối với trường hợp khuôn mặt ở xa hoặc hình ảnh mờ, không rõ nét sẽ không thể xác định được.
- HOG yêu cầu tính toán phức tạp hơn, đặc biệt là trong các bước như trích xuất đặc trưng và huấn luyện các bộ phân loại. Điều này khiến cho thời gian xử lý gia tăng, đặc biệt trong điều kiện có nhiều đối tượng.
LBP:
Điểm mạnh:
- Hiệu quả trong việc phát hiện khuôn mặt trong điều kiện ánh sáng không đồng đều hoặc đối tượng có màu sắc khác biệt. Có thể phát hiện gương mặt ở khoảng cách xa cũng như những gương mặt nhỏ trong ảnh.
- Phù hợp trong các ứng dụng phát hiện khuôn mặt trong thời gian thực, đặc biệt là trong môi trường có ánh sáng không đồng đều, như nhận diện khuôn mặt trên các thiết bị di động hoặc các hệ thống có giới hạn về phần cứng và tài nguyên.
Điểm yếu:
- LBP thường ít chính xác hơn HOG trong các điều kiện phức tạp, đặc biệt khi khuôn mặt xuất hiện ở góc nghiêng (kém hơn HOG) hoặc bị che khuất một phần.
- Phát hiện đối tượng gặp khó khăn khi ở những điều kiện khác biệt về góc nghiêng hoặc bị che khuất. Dưới điều kiện ánh sáng tối sẽ không ổn định và giảm độ chính xác khi phát hiện đi đáng kể.
Ứng dụng:
Tương tác ảo (với các thiết bị không chạm, người máy, trợ lý ảo):
- Phát hiện và nhận diện khuôn mặt trong các hệ thống an ninh, như cửa ra vào thông minh, hệ thống nhận diện khuôn mặt cho điện thoại hoặc máy tính, và các ứng dụng giám sát video.
32
- Phát hiện khuôn mặt để tương tác trong các ứng dụng di động, ví dụ như các trò chơi yêu cầu người chơi sử dụng cảm biến khuôn mặt hoặc các ứng dụng AR (thực tế tăng cường) hay tiêu biểu là camera chụp hình.
- Các hệ thống trợ lý ảo (như Google Assistant, Siri) có thể sử dụng phát hiện khuôn mặt để điều chỉnh các cài đặt giao tiếp, chẳng hạn như nhận dạng người dùng và tùy chỉnh các phản hồi hoặc dịch vụ theo người dùng đó.
Chăm sóc sức khỏe và lĩnh vực y tế:
- Có thể được sử dụng để phát hiện khuôn mặt trong các ứng dụng chẩn đoán, hỗ trợ bác sĩ hoặc các chuyên gia y tế nhận diện các triệu chứng hoặc thay đổi trên khuôn mặt của bệnh nhân (ví dụ, trong phân tích cảm xúc hoặc nhận dạng tình trạng sức khỏe).
Giám sát thời gian thực:
- Sử dụng trong các hệ thống giám sát an ninh để nhận diện khuôn mặt trong đám đông, giúp xác định các đối tượng cần chú ý, hỗ trợ điều tra hoặc thu thập thông tin.
CHƯƠNG IV: KẾT LUẬN
Sau quá trình tìm hiểu và thực hiện bài tập lớn, em đã có thêm hiểu biết về phương pháp trích xuất đặc trưng LBP và HOG cũng như cài đặt thành công chương trình phát hiện mặt người sử dụng thuật toán HOG/LBP.
HOG và LBP là các phương pháp mạnh mẽ trong việc phát hiện khuôn mặt, nhưng mỗi phương pháp có những điểm mạnh và yếu riêng biệt. HOG thích hợp hơn với các tình huống có sự thay đổi về góc độ và chi tiết hình ảnh, trong khi LBP lại tỏ ra vượt trội trong việc xử lý các vấn đề về ánh sáng và thời gian thực.
Cả hai phương pháp đều có thể được kết hợp với các mô hình học máy hoặc học sâu để cải thiện độ chính xác và khả năng phát hiện trong các điều kiện thực tế phức tạp.
Đề tài tập trung vào việc nghiên cứu và phát triển một hệ thống nhận diện khuôn mặt chính xác và hiệu quả. Để đạt được mục tiêu này, đề tài sử dụng các kỹ thuật như HOG hoặc LBP để trích xuất các đặc trưng từ hình ảnh khuôn mặt.
Sau đó, SVM hoặc các phương pháp phân loại khác được sử dụng để phân loại các đặc trưng này thành các lớp khuôn mặt và không phải khuôn mặt.
Dù đã đạt được mục tiêu cơ bản là phát hiện gương mặt, song chương trình vẫn chưa phát huy được tối đa tiềm năng của HOG và LBP, dẫn đến việc phát hiện khuôn mặt chưa được hiệu quả trong các điều kiện phức tạp (ánh sáng, số lượng, góc độ,…) cũng như bị tác động bởi các yếu tố khác như phần cứng hay lập trình trong quá trình vận hành làm giảm hiệu suất cũng như tốc độ của chương trình.
Để khắc phục những hạn chế này, cần có sự kết hợp giữa các thuật toán học sâu tiên tiến, dữ liệu huấn luyện đa dạng và các công nghệ phần cứng mạnh mẽ.
Phát hiện gương mặt sẽ là bước cơ bản cho các ứng dụng công nghệ cho sau này, chương trình có thể tiếp tục mở rộng trở thành một phần trong những bài toán khác như nhận dạng mặt người, nhận dạng cảm xúc, … hoặc được sử dụng, ứng dụng và kết hợp vào các hệ thống IoT tiên tiến sẽ nâng cao khả năng hoạt động của hệ thống.
Với tiềm năng ứng dụng rộng lớn và lợi ích đa dạng, việc phát triển và hoàn thiện hệ thống phát hiện hay nhận diện gương mặt sẽ luôn là một lĩnh vực nghiên cứu hứa hẹn, giúp mang lại nhiều đột phá và tiện ích về công nghệ cho tương lai. Góp phần xây dựng một xã hội số hiện đại, thuận tiện và văn minh hơn.
34