Xây dựng không gian khuôn mặt

Một phần của tài liệu Dò tìm phát hiện mặt người bằng mạng neural nhân tạo và PCA (Thuần code) (Trang 102 - 103)

Quay lại với mô hình của Rowley:

Hình 5.9. Mô hình dò tìm phát hiện mặt người bằng mạng neural của Rowley Bây giờ hãy chú ý ở bước tiền xử lý ảnh và mạng neural, bởi vì ta phải tiến hành phân lớp trước rồi mới có thể thực hiện bước 1, tức là dùng một cửa sổ để quét qua ảnh. Việc bây giờ ta cần làm là ta đã có 102 ảnh học đã được tiền xử lý, công việc tiếp theo là ta biểu diễn ảnh thành dữ liệu để làm dữ liệu đầu vào cho mạng neural.

Như đã nói ở phần 5.1.3.1, ta sử dụng cỡ ảnh có kích thước 25 × 25 (Trong ví dụ mô hình này Rowley xài cỡ 20 × 20). Theo như bước 1 tính toán đã đề cập trong phần PCA thì ta sẽ biểu diễn ảnh 25 × 25 này thành một vector 625 chiều (Trong ví dụ là 3 × 3 và biểu diễn thành vector 9 chiều). Ở đây ta hoàn toàn có thể đưa vào mạng neural để tiến hành huấn luyện cho mạng, nhưng ở đây nếu chú ý, chúng ta sẽ thấy rằng một ảnh biểu diễn dưới 625 chiều là khá lớn, vì vậy ý tưởng xuất phát bắt đầu ở đây: Ta sẽ tiến hành dùng phương pháp PCA để giảm số chiều dữ liệu này xuống.

Cụ thể ở đây trước khi ta huấn luyện mạng neural, ta sẽ tiến hành sử dụng 102 ảnh mặt người này để xây dựng không gian khuôn mặt (Facespace). Cách tính toán sẽ không đề lại ở đây, trong đồ án này tác giả chọn ngưỡng để giữ lại k vector riêng lớn nhất là 0.95, kết quả thu được là 47 vector riêng (Eigenface), đây chính là các vector cơ sở trong không gian mới.

90

Một phần của tài liệu Dò tìm phát hiện mặt người bằng mạng neural nhân tạo và PCA (Thuần code) (Trang 102 - 103)

Tải bản đầy đủ (PDF)

(170 trang)