Huấn luyện phân vùng màu da

Một phần của tài liệu Hệ thống phát hiện khuôn mặt dựa trên mạng neural và phương pháp vân vùng màu da (Trang 75 - 81)

2. Huấn luyện phân vùng và phân vùng màu da dựa trên mô hình phân phối Gaussian

2.1 Huấn luyện phân vùng màu da

2.1.1 Cơ sở để huấn luyện

Như đã đề cập, ảnh được dùng để huấn luyện phân vùng màu da là tập 100 ảnh mẫu kích thước 30 x 40 màu da được trích chọn thủ công từ nhiều bức ảnh khác nhau, bao gồm đầy đủ các màu da của các chủng tộc và châu lục được biết đên như châu Âu, châu Á, Châu Mỹ, Châu Phi… Để giảm độ sai lệch của bộ tham số học được sau quá trình huấn luyện, ảnh đầu vào được tiến hành lọc thông thấp giảm nhiễu.

Không gian sử dụng để mô hình hóa màu da là không gian YCrCb, sở dĩ chúng ta chọn không gian màu này là do, công thức chuyển đổi từ không gian RGB sang YCrCb là khá đơn giản, hơn nữa trong không gian nay, sự độc lập giữa độ sáng và các thành phần màu là rất cao.

Công thức chuyển đổi từ RGB sang YcrCb

Một lý do để lựa chọn không gian màu YCrCb nữa đó là, theo khảo sát của các nhà nghiên cứu, sự phân bố của màu da người trong mặt phẳng CrCb là tương đối tập trung và nhỏ lẻ [8]. Có thể thấy điều này trong hình minh họa sau:

Hình 18: Phân bố màu da trong mặt phẳng CrCb của không gian YCrCb

Theo những nghiên cứu trước đây, màu da con người có những đặc trưng phân biệt đồng thời, chúng ta khác nhau về màu da chủ yếu là do khác nhau về độ sáng hơn là sự khác nhau về các thành phần màu. Hình phấn bố màu da trong

không gian ba thành phần của không gian màu YCrCb sau đây sẽ cho chúng ta thấy điều đó.

:

Khi chuyển sang phân phối Gaussian để biểu diễn người ta thu được phân bố màu da trong mô hình Gaussian như hình vẽ dưới đây:

Hình 20: Phân bố màu da trong phân phối Gaussian biểu diễn trong không gian màu YCrCb

Từ kết quả của biểu diễn này, người ta nhận thấy, với một pixel màu thì có thể tính được xác suất nó là ảnh màu da theo công thức sau đây:

Trong đó c là vector mẫu màu da được trích chọn, khi biểu diễn trong YCrCb thì c= (CrCb)T, µs là vector trung bình của phân bố, còn Σs là ma trận hiệp phương sai của phân bố. Chúng được tính theo công thức:

[III.3]

Với n là tổng số mẫu mà da được huấn luyện.

Để có thể tìm ra được bộ tham số µs, Σs và xác suất ngưỡng dưới nhỏ nhất. Chúng ta tiến hành huấn luyện theo quá trình như sau.

2.1.2 Huấn luyện phân vùng màu da

Với mỗi ảnh trong tập cơ sở huấn luyện, sau khi chuyển sang không gian màu YCrCb, chúng ta biểu diễn x = (CrCb)T là vector các giá rị CrCb trung bình của tất cả các giá trị CrCb tại tất cả các điểm ảnh của ảnh đó.

Với n ảnh màu da huấn luyện, chúng ta tìm được vector trung bình của tất cả các ảnh trong cớ sở dữ liệu:

[III.4]

Trong đó, j là vector của ảnh j trong cớ sơ dữ liệu, m là vector trung bình và E là toán tử kì vọng.

Từ đó chúng ta tính được ma trận hiệp phương sai cua vector x trong cơ sở dữ liệu theo công thức:

[III.5]

Sau khi tính được C và m, chúng ta sủ dụng hàm phân phối Gaussian hai chiều cho vector x tại mỗi điểm ảnh trong mỗi ảnh mẫu màu da trong cơ sở dữ liệu:

P(Cr, Cb) = Exp[-0.5(x-m)TC-1(x-m)] (III.6)

Ta có giá trị P tương ứng với tất cả các điểm ảnh trong tất cả các ảnh thuộc cơ sở dữ liệu ảnh màu da. 0 < P < 1. Tìm giá trị nhỏ nhất của P, chúng ta sẽ thu được một ngưỡng phân vùng ảnh. Ngưỡng xác suất này sẽ được dùng để phân loại một điểm ảnh có là điểm ảnh màu da hay không.

Kết quả thực nghiệm trong đồ án, huấn luyện với tập 100 ảnh mẫu, chúng ta thu được bộ tham số phân vùng như sau:

Vector trung bình:

Và giá trị nhỏ nhất của P học được đó là: MinPro = 0.00004025

Một phần của tài liệu Hệ thống phát hiện khuôn mặt dựa trên mạng neural và phương pháp vân vùng màu da (Trang 75 - 81)

Tải bản đầy đủ (DOC)

(123 trang)
w