Phân loại, nhận dạng

Một phần của tài liệu Xây dựng hệ thống nhận diện khuôn mặt và cảm xúc dùng mạng nơ ron tích chập (Trang 64 - 65)

Khối này có chức năng đối chiếu các véc-tơ đặc tính được tạo ra với cơ sở dữ liệu, từ đó đưa ra kết quả nhận dạng. Có nhiều thuật toán để sử dụng cho phân loại nhận dạng, trong hệ thống nhận dạng khuôn mặt này, cá nhân thực hiện đề tài đã nghiên cứu sử dụng thuật toán so sánh khoảng cách Euclide. Hình 3.10 thể hiện quá trình của phân loại, nhận dạng

Hình 3.10: Sơ đồ quá trình phân loại nhận dạng

Không gian Euclide n chiều được hiểu là không gian phẳng tương ứng với tập hợp (x1, x2, x3,…, xn) hay Rn mang tính tuyến tính với n vector cơ sở trực chuẩn là (1, 0,...,0),(0, 1,...,0),...,(0,...,0, 1).

43

Khoảng cách Eucide trong không gian n chiều, Tổng quát cho hai điểm A (a1, a2, …, an) và B(b1, b2,…, bn) trong không gian Euclide n chiều với hệ cơ sở là n vector trực chuẩn. Khoảng cách A và B là:

AB = |𝐴𝐵|⃗⃗⃗⃗⃗⃗⃗⃗⃗ = √(𝑏1− 𝑎1)2+ (𝑏2− 𝑎2)2+ ⋯ + (𝑏𝑛− 𝑎𝑛)2 (3.1)

Mỗi bức ảnh khuôn mặt sau khi mã hóa trả về kết quả 128 giá trị đặc trưng cho khuôn mặt, có thể biễn diễn là một điểm trong không gian Euclide. Để đánh giá độ tương đồng giữa hai khuôn mặt ta có thể dựa vào khoảng cách của chúng lớn hay nhỏ.

Khoảng cách Euclide là phương pháp đơn giản nhất, nó có kết quả tốt đối với các đối tượng tạo thành các nhóm cách xa nhau [8]. Véc-tơ đặc tính các đối tượng cần nhận dạng sẽ được so sánh với từng ảnh mẫu đã được học trước đó, các khoảng cách ngắn nhất sẽ được lưu lại. Nếu khoảng cách ngắn nhất đó nhỏ hơn ngưỡng mà chúng ta cho phép thì sẽ được xác nhận rằng “ có đối tượng”.

Việc nhận dạng được thực hiện qua phép so sánh: Nếu 𝜀 ≤ 𝑛𝑔ưỡ𝑛𝑔, thì ta xác nhận ảnh “có đối tượng” và nếu 𝜀 > 𝑛𝑔ưỡ𝑛𝑔, thì ta xác nhận ảnh “không có đối tượng”. Giá trị ngưỡng này được điều chỉnh cho từng bộ cơ sở dữ liệu và 𝜀 là khoảng cách ngắn nhất được tính bởi phương pháp Euclide thông qua biểu thức khoảng cách 3.1 được đề cập phía trên.

Nếu hệ thống cho kết quả nhận dạng là có đối tượng thì hệ thống sẽ tìm đến một tập dữ liệu chứa các thông tin đối tượng vừa tìm được. Các thông tin sẽ được hiển thị trên giao diện màn hình.

Một phần của tài liệu Xây dựng hệ thống nhận diện khuôn mặt và cảm xúc dùng mạng nơ ron tích chập (Trang 64 - 65)

Tải bản đầy đủ (PDF)

(109 trang)