5 KẾT QUẢ MÔ PHỎNG
2.11 Biểu diễn ảnh khuôn mặt trong không gian với nhãn của các ảnh là các
[52]
Phương pháp [52] đề xuất một phương pháp nhận dạng khuôn mặt dựa trên bộ phân loại hồi quy tuyến tính. Các ảnh sẽ được biểu diễn trong không gian nhãn với nhãn của các lớp sẽ được biểu diễn thành các trục tọa độ như hình 2.11. Ảnh kiểm tra sẽ được chia thành các ảnh nhỏ không chồng lắp và được đặt trên một trục cách đều các trục tọa độ. Bộ phân loại sẽ sử dụng cách voting để nhận dạng ảnh. Phương pháp này bỏ qua các thông tin toàn cục của bức ảnh để tập trung vào các đặc trưng cục bộ của ảnh nên cho kết quả nhận dạng tốt trong các điều kiện không lý tưởng của ảnh khuôn mặt.
Liu [53] đã đề xuất một phương pháp học bán giám sát cho nhận dạng khuôn mặt, trong đó một cải tiến của phương pháp trích đặc trưng SRC được giới thiệu, phương pháp Structured optimal graph based sparse feature extraction (SOGSFE). Bên cạnh đó, một thuật toán tối ưu mới cũng được giới thiệu trong phương pháp này nhằm giải quyết bài toán tối ưu hàm mục tiêu của phương pháp SOGSFE. Các kết quả mô phỏng cho thấy rằng phương pháp trích đặc trưng này cho kết quả tốt hơn các phương pháp trích đặc trưng cục bộ khác. Tuy nhiên, một ma trận tính toán sự tương tự của các vector đặc trưng của các ảnh trong cơ sở dữ liệu phải được tính toán cập nhật với số vòng lặp rất lớn dẫn đến thời gian nhận dạng lớn. Phương pháp [54] cũng sử dụng phương pháp SRC để trích đặc trưng ảnh khuôn mặt, trong đó ảnh khuôn mặt sẽ được chia thành hai phần và sử dụng phương pháp SRC để trích đặc trưng của từng phần. Các vector đặc trưng của từng phần sẽ được phân lớp một cách độc lập nhau. Việc phân loại ảnh đầu vào sẽ giữa vào sai lệch tối thiểu giữa hai phần với nhau.
Nhìn chung, nhóm phương pháp trên có ưu điểm là có thể biểu diễn một cách hạn chế sự thay đổi trong cùng một lớp đối với bài toán nhận dạng khuôn mặt trong điều kiện SSPP nên có thể áp dụng các phương pháp nhận dạng khuôn mặt trong điều kiện đa mẫu để giải quyết bài toán SSPP. Tuy nhiên nhược điểm chung của nhóm phương pháp này là việc không đưa ra được một phương pháp tối ưu để chọn kích thước các ảnh nhỏ hay hình dạng các ảnh nhỏ, mặc dù sự lựa chọn này ảnh hưởng trực tiếp đến tính chính xác
trong việc nhận dạng. Các sự lựa chọn này thường mang tính chủ quan của các tác giả. Ngoài ra, còn có một số các phương pháp sử dụng các đặc trưng cục bộ được trích từ các điểm đặc trưng như là đặc trưng của ảnh khuôn mặt. Các phương pháp này có ưu điểm là việc trích đặc trưng cục bộ từ một số điểm đặc trưng có thể khắc phục được việc ảnh hưởng chủ quan lên việc chọn cách trích đặc trưng như đề cập ở trên, cũng như không đòi hỏi phải biết trước thông tin về ảnh khuôn mặt. Tuy nhiên nhược điểm của các phương pháp nhận dạng khuôn mặt dựa trên đặc trưng được trích từ các điểm đặc trưng là việc phải chọn được các điểm trích đặc trưng thích hợp. Các pixel cạnh là các điểm đặc trưng thường được sử dụng rộng rãi trong các phương pháp nhận dạng nói chung và nhận dạng khuôn mặt nói riêng vì các pixel cạnh thể hiện rất tốt cấu trúc, hình dạng của vật thể hay khuôn mặt. Ngoài ra, các pixel cạnh cũng là một đặc trưng rất bền vững với các điều kiện không lý tưởng của ảnh khuôn mặt, nhất là trong trường hợp ảnh khuôn mặt bị chiếu sáng khác nhau [14]. Các phương pháp này có tỷ lệ nhận dạng chính xác tương đối cao, đơn giản và dễ thực hiện trong các ứng dụng thực tế.
2.1.3 Các phương pháp nhận dạng khuôn mặt dựa trên việc tạothêm ảnh ảo thêm ảnh ảo
Các phương pháp nhận dạng khuôn mặt dựa trên việc tạo thêm ảnh ảo sẽ bằng các cách thức khác nhau tạo thêm ảnh ảo, giúp làm tăng thêm số lượng ảnh cho mỗi lớp. Điều này giúp có thể áp dụng các phương pháp nhận dạng khuôn mặt trong điều kiện đa mẫu để giải quyết bài toán nhận dạng khuôn mặt trong điều kiện SSPP. Một số phương pháp nhận dạng khuôn mặt trong điều kiện SSPP dựa trên việc tạo ra các mẫu ảo trong những năm gần đây có thể được kể đến như sau.
Phương pháp [55] đề xuất tạo thêm ảnh ảo bằng cách lấy mẫu theo chiều dọc và ngang của ảnh khuôn mặt sau đó sẽ phóng to ảnh ảo để đạt được kích thước ban đầu. Ảnh gốc cùng 8 ảnh ảo sẽ cùng nhau tạo thành 9 ảnh cho mỗi lớp trong cơ sở dữ liệu. Các vector đặc trưng của ảnh khuôn mặt sẽ được trích bằng phương pháp FLDA và được phân lớp bằng bộ phân loại NN. Phương pháp này rất đơn giản nhưng kết quả nhận dạng không thực sự ấn tượng. Phương pháp [56] đề xuất phương pháp tạo ảnh ảo dựa trên phân rã QR, trong đó ảnh gốc sẽ được phân rã sau đó các thành phần cơ bản đầu tiên được kết hợp lại để tạo thành ảnh ảo. Ảnh gốc cùng 2 ảnh ảo sẽ tạo thành bộ 3 ảnh cho mỗi lớp trong cơ sở dữ liệu. Phương pháp FLDA được dùng để trích đặc trưng của ảnh và bộ phân loại NN được dùng để phân lớp các vector đặc trưng. Phương pháp [57] cũng được thực hiện giống phương pháp [56] nhưng có thêm việc khảo sát để chọn ra số thành phần cơ bản tối ưu của phân rã QR để tạo ra ảnh ảo. Các kết quả cho thấy phương pháp [57] cho kết quả nhận dạng cao hơn phương pháp [56]. Tuy nhiên, nhược điểm của cả hai phương pháp [57] và [56] là việc tạo ra ảnh ảo có độ phức tạp tương đối cao.