Hướng tiếp cận rút trích đặc trưng dựa vào giảm chiều

Một phần của tài liệu Đề tài kỹ thuật định danh khuôn mặt dựa vào mẫu nhị phân (Trang 38 - 40)

Giảm chiều có thể được sử dụng để giải quyết một số thách thức ảnh hưởng đến việc nhận dạng như lỗi đăng ký, biến đổi ánh sáng. Các thành phần làm giảm chiều có thể hoạt động trên nhiều lớp, chẳng hạn như giai đoạn tiền xử lý (ví dụ: giảm kích thước ảnh đầu vào, áp dụng mặt nạ) và các lớp đặc trưng bên trong. Trong phần này, chúng tôi phân các kỹ thuật này thành 3 nhóm: phương pháp tổng hợp đặc trưng, phương pháp lựa chọn đặc trưng và phương pháp rút trích đặc trưng

2.1.3.1 Phương pháp tổng hợp đặc trưng

Tổng hợp đặc trưng là một phương pháp giảm số chiều đặc trưng của các khối cục bộ bằng cách biểu diễn đặc trưng các khối trong mối liên kết với nhau. Tổng hợp thường được áp dụng trên nhiều khu nhỏ giao nhau trên ảnh. Có nhiều kỹ thuật tổng hợp khác nhau, chẳng hạn như gắn kết các đặc trưng thông qua biểu đồ mật độ cục bộ, lấy mẫu giá trị tối thiểu hoặc tối đa trong một vùng lân cận hoặc tính tổng, trung bình đặc trung trong vùng lân cận [67], [68]. Ảnh hưởng của sự thay dổi ánh sáng thường được giải quyết bằng cách chuẩn hóa giá trị được tổng hợp.

23

2.1.3.2 Phương pháp lựa chọn đặc trưng

Phương pháp này chọn ra một tập hợp con các đặc trưng và đánh trọng số cho những đặc trưng được chọn. Quá trình xử lý này được thiết kếđể có một ngữ nghĩa nhất định, chẳng hạn như khám phá không gian [13], [69] hoặc không gian – thời gian [70] khu vực quan tâm. Lựa chọn tính năng có thể áp dụng với một nhóm kỹ thuật. Một hình thức đơn giản là chọn và đánh trọng số thủ công cho một số vùng [13]. Hầu hết hệ thống lựa chọn dựa vào kỹ thuật boosting. AdaBoost và GentleBoost [71] là các kỹ thuật boosting phổ biến nhất.

2.1.3.3 Phương pháp rút trích đặc trưng

Các phương pháp rút trích đặc trưng trích chọn các đặc trưng tìm năng bằng cách chiếu dữ liệu sang không gian với số chiều nhỏ hơn để khai thác cấu trúc tìm ẩn cho việc biểu diễn. Các phương pháp phổ biến của hướng tiếp cận này là DCT, PCA, LDA. Phép biến đổi PCA tìm cách tối đa khoảng cách các mẫu sau khi chiếu. LDA tìm cách tối đa khoảng cách giữa các lớp sau khi chiếu và tối tiểu khoảng cách của các mẫu trong cùng một nhóm. Nhìn chung, LDA cho kết quả nhận dạng mặt người đạt hiệu quả cao hơn so với phương pháp PCA. Gần đây, một số biến thể của LDA [72-75] đã được đưa ra, chủ yếu để giải quyết vấn đề kích thước nhỏ (kích thước của không gian hình ảnh lớn hơn nhiều so với số lượng mẫu huấn luyện). Tất cả các phương pháp được mô tả ở trên yêu cầu các mẫu đầu vào phải được định hình dưới dạng vector. Điều này dẫn đến một không gian vector lớn và tốn nhiều thời gian để tính các vector riêng của một ma trận hiệp phương sai lớn. Các nghiên cứu gần đây đang tìm cách trích xuất các đặc trưng trực tiếp trên các mẫu ảnh, tức là sự đại diện của một mẫu ảnh được giữ lại dưới dạng ma trận. Dựa vào ý tưởng này, một số thuật toán nổi tiếng được phát triển, bao gồm phân tích thành phần chính hai chiều (2D-PCA) [76] [77], phân tích tách lớp tuyến tính hai chiều (2D-LDA) [78], và phân tích tách lớp tuyến tính hai chiều theo dòng và theo cột ((2D)2LDA) [79-80]. Trong các hướng tiếp cận này, hướng tiếp cận (2D)2LDA cho đặc trưng có kích thước nhỏ và có tính tách lớp cao do vậy đạt hiệu năng nhận dạng cao.

24

Một phần của tài liệu Đề tài kỹ thuật định danh khuôn mặt dựa vào mẫu nhị phân (Trang 38 - 40)