Các yếu tố để nhận diện khuôn mặt - Thời gian và đ- 123docz.net

6. Thời gian và địa điểm thực hiện

1.3.4 Các yếu tố để nhận diện khuôn mặt

Một số thuật toán nhận dạng khuôn mặt xác định các đặc điểm khuôn mặt bằng cách trích xuất các ranh giới, hoặc đặc điểm, từ một hình ảnh khuôn mặt của đối tượng. Ví dụ, một thuật toán có thể phân tích các vị trí tương đối, kích thước, và/hoặc hình dạng của mắt, mũi, gò má, và cằm. Những tính năng này sau đó được sử dụng để tìm kiếm các hình ảnh khác với các tính năng phù hợp. Các thuật toán bình thường hóa một bộ sưu tập các hình ảnh khuôn mặt và sau đó nén dữ liệu khuôn mặt, chỉ lưu dữ liệu hình ảnh nào là hữu ích cho việc nhận dạng khuôn mặt. Một hình ảnh mẫu sau đó được so sánh với các dữ liệu khuôn mặt. Một trong những hệ thống thành công sớm nhất dựa trên các kỹ thuật phù hợp với mẫu áp dụng cho một tập hợp các đặc điểm khuôn mặt nổi bật, cung cấp một dạng đại diện của khuôn mặt được nén.

Các thuật toán nhận dạng có thể được chia thành hai hướng chính, là hình học, đó là nhìn vào tính năng phân biệt, hoặc trắc quang (đo sáng), là sử dụng phương pháp thống kê để 'chưng cất' một hình ảnh thành những giá trị và so sánh các giá trị với các mẫu để loại bỏ chênh lệch.

- Nhận dạng 3-chiều:

Một xu hướng mới nổi lên, tuyên bố cải thiện được độ chính xác, là nhận dạng khuôn mặt ba chiều. Kỹ thuật này sử dụng các cảm biến 3D để nắm bắt thông tin về hình dạng của khuôn mặt. Thông tin này sau đó được sử dụng để xác định các tính năng đặc biệt trên bề mặt của một khuôn mặt, chẳng hạn như các đường viền của hốc mắt, mũi và cằm.

Một lợi thế của nhận dạng khuôn mặt 3D là nó không bị ảnh hưởng bởi những thay đổi trong ánh sáng như các kỹ thuật khác. Nó cũng có thể xác định một khuôn mặt từ một loạt các góc nhìn, trong đó có góc nhìn nghiêng. Các điểm dữ liệu ba chiều từ một khuôn mặt cải thiện lớn độ chính xác cho nhận dạng khuôn mặt. Nghiên cứu 3D được tăng cường bởi sự phát triển của các bộ cảm biến tinh vi giúp nắm bắt hình ảnh chụp khuôn mặt 3D được tốt hơn. Các cảm biến hoạt động bằng cách chiếu ánh sáng có cấu trúc lên gương mặt. Hàng chục hoặc nhiều hơn nữa các bộ cảm biến hình ảnh này có thể được đặt lên trên cùng một con chip CMOS-mỗi cảm biến sẽ thu một phần khác nhau của hình ảnh.

Ngay cả một kỹ thuật 3D hoàn hảo cũng có thể gặp khó khăn bởi các sắc thái biểu cảm trên gương mặt. Để đạt được mục tiêu đó một nhóm tại Technion (viện công nghệ Israel tại Haifa) đã áp dụng các công cụ từ hình học metric để giải quyết các biểu lộ cảm xúc như phép đẳng cự Một công ty có tên Vision Access tạo ra một giải pháp vững chắc cho nhận dạng khuôn mặt 3D. Công ty này sau đó đã được mua lại bởi công ty truy cập sinh trắc học Bioscrypt Inc. Công ty đã phát triển một phiên bản được gọi là 3D FastPass.

- Phân tích kết cấu da:

Một xu hướng mới nổi sử dụng các chi tiết hình ảnh của da, được chụp trong các hình ảnh kỹ thuật số hoặc máy scan tiêu chuẩn. Kỹ thuật này được gọi là phân tích kết cấu da, đưa các đường đặc trưng, hình dạng, và các điểm nốt trên làn da của một người vào một không gian toán học.

Các thử nghiệm đã chỉ ra rằng với việc bổ sung các phân tích cấu trúc của da, hiệu quả trong việc nhận ra khuôn mặt có thể tăng 20-25 phần trăm.

1.4Kết luận chương 1

Như vậy qua chương 1, ta đã có cái nhìn tổng quan nhất về xử lý ảnh trong giám sát an ninh, mục đích, đối tượng, phạm vi và ý nghĩa thực tiễn của ứng dụng này. Ngoài ra, ta cũng đã tìm hiểu về tình hình thực tế xử lý ảnh trong giám sát an ninh trong và ngoài nước, một số phương pháp nhận dạng đã và đang có trên thị trường. Nhận thấy vấn đề an ninh luôn là vấn đề được quan tâm cấp thiết hàng đầu và nó có nhiệm vụ bảo vệ cho con người, cho xã hội, đồng thời phương pháp nhận diện khuôn mặt có nhiều ưu điểm và tiềm năng phát triển cho việc giám sát an ninh nên em đã thực hiện nghiên cứu đề tài “Nghiên cứu, phát triển hệ thống nhận dạng khuôn mặt trong giám sát an ninh trong tòa nhà”. Mục tiêu của đồ án hướng đến xây dựng hệ thống nhận diện khuôn mặt đảm bảo các thông số kỹ thuật như sau: thời gian nhận diện dưới 1 giây, khoảng cách nhận diện lên tới 5 mét, tỷ lệ che khuôn mặt khoảng 2/3, có thể nhận diện nhiều người trong cùng một khung hình, tốc độ di chuyển khoảng 2m/s mà hệ thống vẫn nhận diện được. Chi tiết nội dung cũng như phương pháp nghiên cứu của đề tài, ta sẽ cụ thể ở chương 2.

CHƯƠNG 2. NỘI DUNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU

2.1Yêu cầu thiết kế hệ thống nhận diện khuôn mặt đảm bảo an ninh trong tòa nhà.

Với đề tài “Nghiên cứu, phát triển hệ thống nhận diện khuôn mặt phục vụ giám sát an ninh” này, phạm vi mô hình của em là thực hiện việc phát hiện nhận diện khuôn mặt để đảm bảo an ninh trong tòa nhà. Trong hệ thống dữ liệu có lưu trữ ảnh khuôn mặt và thông tin của những người có trong tòa nhà. Khi hệ thống nhận diện phát hiện sẽ đối chiếu với thông tin có trong dữ liệu, từ đó có thể phát hiện người lạ ra vào tòa nhà, kịp thời cảnh báo gửi đến email người quản lý.

Thiết kế hệ thống nhận diện khuôn mặt với OpenCV và Deep Learning đảm bảo các yêu cầu sau đây:

 Hệ thống có thể phát hiện, nhận diện được khuôn mặt đối tượng  Hệ thống gửi thông tin cảnh báo về email

 Sử dụng OpenCV và Deep Learning  Giao diện thân thiện, dễ sử dụng  Độ chính xác đạt trên 90%  An toàn và tiết kiệm chi phí

Dựa trên toàn bộ những yêu cầu của bài toán như trên, ta bắt đầu xây dựng lưu đồ thuật toán và hoàn thiện giao diện chương trình nhận dạng.

2.2Các phương pháp nhận diện khuôn mặt 2.2.1 Nhận diện khuôn mặt dựa trên tri thức

Phương pháp này dựa trên tập hợp các quy tắc do con người phát triển theo hiểu biết của chúng ta. Chúng ta biết rằng một khuôn mặt phải có mũi, mắt và miệng trong khoảng cách và vị trí nhất định với nhau. Vấn đề của phương pháp này là xây dựng một bộ quy tắc thích hợp. Nếu các quy tắc quá chung chung hoặc quá chi tiết, hệ thống sẽ dẫn đến nhiều kết quả xác thực sai. Tuy nhiên, nó không hoạt động với

tất cả các màu da và phụ thuộc vào điều kiện ánh sáng có thể thay đổi màu da chính xác của một người trong ảnh.

2.2.2 Đối sánh mẫu

Phương pháp đối sánh mẫu sử dụng các mẫu khuôn mặt được xác định trước hoặc được tham số hóa để xác định vị trí hoặc phát hiện các khuôn mặt bằng mối tương quan giữa các mẫu được xác định trước hoặc có thể biến dạng và hình ảnh đầu vào. Mô hình khuôn mặt có thể được xây dựng theo các cạnh bằng phương pháp phát hiện cạnh.

Một biến thể của cách tiếp cận này là kỹ thuật nền có kiểm soát .Nếu bạn may mắn có được hình ảnh chính diện và hình nền đơn giản, bạn có thể xóa phông nền, để lại ranh giới khuôn mặt.

Đối với cách tiếp cận này, phần mềm có một số bộ phân loại để phát hiện các loại khuôn mặt trực diện khác nhau và một số bộ phân loại cho khuôn mặt thông thường, chẳng hạn như bộ phát hiện mắt, mũi, miệng và trong một số trường hợp, thậm chí là toàn bộ cơ thể. Mặc dù cách tiếp cận này dễ thực hiện, nhưng nó thường không đủ khả năng nhận diện khuôn mặt.

2.2.3 Nhận diện khuôn mặt dựa trên ngoại hình

Phương pháp dựa trên ngoại hình tiên tiến hơn phụ thuộc vào một tập hợp các hình ảnh khuôn mặt đào tạo đại biểu để tìm ra các mô hình khuôn mặt. Nó dựa vào học máy và phân tích thống kê để tìm các đặc điểm liên quan của hình ảnh khuôn mặt và trích xuất các đặc điểm từ chúng. Phương pháp này hợp nhất một số thuật toán:

Thuật toán dựa trên Eigenface thể hiện hiệu quả các khuôn mặt bằng cách sử dụng Phân tích thành phần chính (PCA). PCA được áp dụng cho một tập hợp hình ảnh để hạ thấp kích thước của tập dữ liệu, mô tả tốt nhất phương sai của dữ liệu. Trong phương pháp này, một khuôn mặt có thể được mô hình hóa như một tổ hợp tuyến tính của các eigenfaces (tập hợp các eigenvector). Nhận dạng khuôn mặt, trong trường hợp này, dựa trên việc so sánh các hệ số của biểu diễn tuyến tính.

Cácthuật toándựa trên phân phối như PCA và Fisher's Discriminant xác định không gian con đại diện cho các mẫu khuôn mặt. Chúng thường có một bộ phân loại được đào tạo để xác định các trường hợp của lớp mẫu đích từ các mẫu ảnh nền. Mô hình Markov ẩn là một phương pháp tiêu chuẩn cho các nhiệm vụ phát hiện. Trạng thái của nó sẽ là các đặc điểm trên khuôn mặt, thường được mô tả dưới dạng các dải pixel.

Mạng lưới Winnows thưa thớt xác định hai đơn vị tuyến tính hoặc các nút đích: một cho các mẫu khuôn mặt và một cho các mẫu không phải khuôn mặt.

Bộ phân loại Naive Bayes tính toán xác suất của một khuôn mặt xuất hiện trong hình ảnh dựa trên tần suất xuất hiện của một loạt mẫu trên các hình ảnh huấn luyện. Học quy nạp sử dụng các thuật toán như C4.5 của Quinlan hoặc FIND-S của Mitchell để phát hiện các khuôn mặt bắt đầu với giả thuyết cụ thể nhất và khái quát hóa.

Mạng nơ-ron, chẳng hạn như GAN, là một trong những phương pháp mới nhất và mạnh nhất đểphát hiện các vấn đề, bao gồm nhận diện khuôn mặt, phát hiện cảm xúc và nhận dạng khuôn mặt.

2.2.4 Nhận diện khuôn mặt dựa trên chuyển động

Trong hình ảnh video, ta có thể sử dụng chuyển động làm hướng dẫn. Một chuyển động cụ thể của khuôn mặt đang nhấp nháy, vì vậy nếu phần mềm có thể xác định kiểu nhấp nháy thông thường, nó sẽ xác định khuôn mặt.

Nhiều chuyển động khác cho thấy rằng hình ảnh có thể chứa một khuôn mặt, chẳng hạn như lỗ mũi loe ra, lông mày nhướng lên, trán nhăn và miệng mở. Khi một khuôn mặt được phát hiện và một mô hình khuôn mặt cụ thể khớp với một chuyển động cụ thể, mô hình sẽ được đặt trên khuôn mặt, cho phép theo dõi khuôn mặt để nhận ra các chuyển động của khuôn mặt. Các giải pháp hiện đại nhất thường kết hợp một số phương pháp, ví dụ, trích xuất các tính năng để được sử dụng trong các thuật toán học máy hoặc học sâu.

2.2.5 Nhận diện khuôn mặt dựa trên tính năng

Phương pháp dựa trên tính năng trích xuất các đặc điểm cấu trúc của khuôn mặt. Nó được đào tạo như một máy phân loại và sau đó được sử dụng để phân biệt các vùng trên khuôn mặt và vùng không phải trên khuôn mặt. Một ví dụ của phương pháp này là tính năng phát hiện khuôn mặt dựa trên màu sắc để quét hình ảnh hoặc video có màu cho các khu vực có màu da điển hình và sau đó tìm kiếm các phân đoạn khuôn mặt.

Lựa chọn tính năng Haar dựa trên các đặc tính tương tự của khuôn mặt người để tạo ra các kết quả phù hợp từ các đặc điểm trên khuôn mặt: vị trí và kích thước của mắt, miệng, sống mũi và các chuyển độ định hướng của cường độ pixel. Có 38 lớp phân loại theo tầng để có được tổng số 6061 đặc điểm từ mỗi mặt chính diện. Histogram of Oriented Gradients (HOG) là một công cụ trích xuất tính năng để phát hiện đối tượng. Các tính năng được trích xuất là sự phân bố (biểu đồ) hướng của các chuyển sắc (gradient định hướng) của hình ảnh.

Histogram of Oriented Gradients (HOG) là một công cụ trích xuất tính năng để phát hiện đối tượng. Các tính năng được trích xuất là sự phân bố (biểu đồ) các hướng của gradient (gradient định hướng) của hình ảnh.

Gradients thường là các cạnh và góc tròn lớn và cho phép chúng ta phát hiện các vùng đó. Thay vì xem xét cường độ pixel, họ đếm số lần xuất hiện của các vectơ gradient để đại diện cho hướng ánh sáng nhằm khoanh vùng các phân đoạn hình ảnh. Phương pháp sử dụng chuẩn hóa độ tương phản cục bộ chồng chéo để cải thiện độ chính xác.

Trong tất cả các phương pháp được nêu trên thì phương pháp nhận diện khuôn mặt dựa trên tính năng là phù hợp và cho hiệu quả tốt nhất cho đồ án này.

2.3Sơ đồ công nghệ của hệ thống nhận diện khuôn mặt

Về cơ bản, nguyên lý hoạt động của hệ thống nhận diện khuôn mặt kiểm soát an ninh trong tòa nhà hoạt động như sau: Khi đối tượng xuất hiện trong khu vực kiểm soát của tòa nhà, camera sẽ phát hiện, chụp lại ảnh và gửi thông tin về hệ thống xử lý. Tại đây hình ảnh khuôn mặt vừa nhận được sẽ được phân tích và so sánh đối

chiếu với dữ liệu lưu trữ các thành viên có trong tòa nhà, nếu khớp thông tin người đó sẽ hiện lên, nếu không khớp thì hệ thống sẽ báo Unknown (không biết), đồng thời gửi email cảnh báo và thông tin ảnh chụp được tới người quản lý hệ thống.

Hình 2. 1 Sơ đồ nguyên lý hoạt động của hệ thống 2.4Các thiết bị phần cứng sử dụng

2.4.1 Webcam Logitech

Logitech HD Webcam C270 thuộc dòng sản phẩm webcam Logitech được ứng dụng công nghệ tinh thể lỏng Logitech Fluid Crystal. Do đó, chất lượng hình ảnh video của nó cũng sẽ cao cấp không kém các dòng sản phẩm webcam Logitech khác, thậm chí là so với các sản phẩm webcam mang các thương hiệu khác ở trên thị trường quốc tế.

Thiết bị này cũng có chức năng phục vụ cuộc gọi video. Với sản phẩm này, hình ảnh trong cuộc gọi video sẽ được hiển thị với chất lượng chuẩn HD (độ phân giải 1280 x 720p). Thêm vào đó, nó còn có khả năng điều chỉnh tự động hiệu ứng ánh sáng. Dù cho người dùng đang tiến hành chức năng gọi video ở không gian địa điểm nào, điều kiện ánh sáng xung quanh ra sao, hình ảnh của người dùng hiển thị thông qua webcam này vẫn sáng rõ, nét căng, không mờ nhòe.

Bên cạnh chức năng quay video và phục vụ cuộc gọi video, nó còn có chức năng chụp ảnh. Tính năng chụp hình nhanh của nó có ý nghĩa rất thiết thực đối với các game thủ nói riêng và nhiều người dùng nói chung. Thiết bị này cho phép độ phân giải tối đa của một tấm hình là 3MP. Với độ phân giải 3MP, chất lượng hình chụp bằng webcam này vẫn được đảm bảo độ sắc nét và màu sắc chân thực.

Ngoài những tính năng vừa kể ra ở trên, nó còn có những tính năng hữu ích khác. Đơn cử như là thiết bị micro của nó có khả năng hạn chế những tác động tiêu cực

của các âm thanh pha tạp ồn ào từ môi trường bên ngoài đến chất lượng truyền âm khi người dùng sử dụng webcam Logitech trong giao tiếp. Tính năng này tuy không mới nhưng chưa bao giờ trở thành vô dụng. Và cũng giống với các dòng sản phẩm webcam Logitech anh chị em của mình, Logitech webcam HD C270 cũng có phần mềm hỗ trợ của nhà sản xuất để giúp người chơi nâng cấp các tính năng mà nó mang lại. Hình 2. 2 Webcam Logitech HD C270 [11] Kích thước: Các kích thước bao gồm kẹp gắn cố định Chiều cao: 72,91 mm Chiều rộng: 31,91 mm Chiều dày: 66,64 mm Độ dài dây: 1,5 m Trọng lượng: 75 g Thông số kĩ thuật:

Độ phân giải tối đa: 720p/30fps Loại tiêu cự: tiêu cự cố định Loại thấu kính: nhựa

Micrô tích hợp: Đơn hướng Tầm nhìn chéo (dFoV): 55°

Kẹp gắn phổ dụng phù hợp với máy tính xách tay, LCD hoặc các màn hình