- 50 - SỬ DỤNG MÔ HÌNHMAXIMUMENTROPY NHẬN DẠNGMÀUDAẢNHMÀU Nguyễn Tuấn Nghĩa MSV: 0122006 Email: nghiak46cb@yahoo.com Người hướng dẫn: ThS.Đào Kiến Quốc 1. Tổng quan Xây dựng hai môhìnhnhậndạngmàudaảnhmàu với ràng buộc lấy từ tập cơ sở dữ liệu Compaq. Mỗi môhình sử dụngentropy cực đại, môhình đầu tiên là môhình Baseline, xem các pixel là độc lập với nhau. Môhình thứ hai là một môhình Markov ẩn (HHM), nó thêm vào ràng buộc hai điểm lân cận nhau có quan hệ xuất hiện màuda và không phải màu da. Cả hai môhình đánh giá xác suất mộ t giá trị màu là màuda p(y s |x), nếu xác suất này cao hơn một ngưỡng thì giá trị màu đó là màuda và ngược lại. 2. Giới thiệu 2.1. Định nghĩa Dò màuda là tìm kiếm trên các pixel màuda của một ảnh màu. Kết quả là một ảnh nhị phân cùng kích cỡ, trong đó màu trắng là da, màu đen là không phải màuda hay còn gọi là nền. 2.2. Phương thức Mô hìnhentropy cực đại là một phương thức suy ra môhình thống kê từ tập cơ sở dữ liệu. Nó th ực hiện như sau: 1) Trích chọn đặc trưng 2) Áp đặt các ràng buộc cho môhình 3) Xây dựngmôhình phân phối có điều kiện p(y|x) 4) Thiết lập tham số môhình 5) Sử dụng lược đồ để phân lớp màuda và không phải màu da. Nhiệm vụ 1,2) chỉ ra các đặc trưng và áp đặt ràng buộc với tập quan sát từ CSDL Compaq 3) khi entropy đạt cực đại, chúng ta có thể tính được phân phối p(y|x) 4) xây dựng tham số cho môhình bằng các đặ c trưng địa phương 5) bằng cách chọn mẫu theo thuật toán lấy Gibbs, sử dụngmẫu này tính p(y s |x). 3. Mô hìnhentropy cực đại 3.1. Một số ký hiệu Gọi tập các giá trị màu là S, giá trị màu tại pixel s là x s , màuda (skinness) của pixel s là y s với y s = 1 nếu s là pixel màuda và y s = 0 nếu y s không phải màu da. Ảnhmàu là được xem là một vector của các pixel màu, được ký hiệu là x và ảnh nhị phân tương ứng được tạo nên bởi các màuda y s là y. Giả sử biết được phân phối đồng thời của vector p(x,y), theo công thức Bayes sẽ tính được phân phối hậu nghiệm p(y|x). Mục tiêu cuối cùng là tính xác suất một giá trị là màuda p(y s =1|x s ) từ phân phối hậu nghiệm. Nhưng chúng ta không biết được phân phối p(x,y) thay vào đó, có thể sử dụng CSDL Compaq. Nó là tập mẫu: {(x (1) ,y (1) ),(x (2) ,y (2) ),…,(x (n) ,y (n) )} trong đó 1 ≤ i ≤ n=18.696, x (1) là một ảnh màu, y (1) là ảnh nhị phân tương ứng, các mẫu là độc lập với nhau và có xác suất phân phối p(x,y). Tập các mẫu cũng được xem như tập dữ liệu học. Xác suất được thiết lập bởi các thiết lập kinh nghiệm và được ký hiệu bởi q. Sau đây, trình bày tóm tắt cách xây dựngmôhình phân phối xác suất màuda với của một ảnhmàu p(y|x). 3.2. Môhình Baseline Xây dự ng môhình tương ứng ràng buộc một pixel bởi dữ liệu Compaq: - 51 - C 0 : ∀ s ∈ S, ∀ x s ∈ C, ∀ y s ∈ {0,1}, p(x s ,y s ) = q(x s ,y s ) Trong đó q(x s ,y s ) là tỉ lệ pixel với màu x s và skinness y s , trong tập dữ liệu học. Theo công thức nhân Larange khi môhình đạt entropy cực đại, ta có: p(y|x) = ∏ s∈S q(y s |x s ) (1) trong đó: q(y s |x s ) = ss 1 (|y)(y) () s s qx q qx với q(x s ) = 1 ss ys=0 (|y)q(y) s qx ∑ Chúng ta tính biểu thức trên bằng hai lược đồ q(x s |y s = 1) và q(x s |y s = 0) tương ứng cho phân phối của các pixel màuda và không phải màu da. 3.3. Môhình Markov ẩn (HMM) Môhình Baseline không có được nhiều chặt chẽ, thực tế cho thấy các vùng da không đơn thuần phân phối ngẫu nhiên mà nó được cấu tạo nên bởi các vùng da rộng. Vì vậy, tăng cường khả năng nhậndạng bằng cách ràng buộc thêm xác suất xuất hiện màuda cho tất cả cặp điểm lân cận nhau. Trong HMM, sử dụng hệ thống 4 lân cận (là lưới các pixel mà xung quanh mỗi pixel có 4 pixel lân cận), theo dõi màuda của hai điểm lân cận s, t: (y s = a, y t = b), khả năng xảy ra đồng thời màuda hay không phải màuda p(a,b) với a = 0,1 và b = 0,1 tương ứng là ràng buộc thuộc tập học. Giả sử rằng môhình MaxEnt là đẳng hướng theo hai hướng ngang và dọc, có nghĩa rằng q(y s ,y t ) = q(y s' ,y t' ) theo cùng một hướng. Ràng buộc HHM như sau: D: ∀s ~ t ∈ S x S, p(y s = 0, y t = 0) = q(0, 0) và p(y s = 1, y t = 1) = q(1, 1). Môhình MaxEnt trong không gian C 0 ∪ D theo phân phối Gibbs là: p(y|x) = ∏ ∈Ss ss yxq xp yp )|( )( )( (2) với p(y)= 0s t st 01 s~t 1 exp ( (1 y )(1 - y) 1 y) (,) () aay Za a −+ ∑ (3) , Z(a 0 ,a 1 ) = 0s t st ys~t exp ( (1 y )(1 - y) 1 y) () aay−+ ∑∑ (4) Hàm Z(a 0 ,a 1 ) là hàm phân hoạch để đảm bảo ràng buộc thỏa mãn. 3.4. Thiết lập tham số Đối với môhình Baseline, có thể dễ dàng tính phân phối p(y|x), tuy nhiên với HMM cần thiết phải thiết lập hai tham số a 0 và a 1 để thỏa mãn ràng buộc. Thiết lập tham số có thể dùng cách tính xấp xỉ, chúng ta sẽ thuật toán Metropolis lấy mẫu thỏa mãn (3) mà không cần biết a 0 và a 1 , sau đó, dùngmẫu này để tính hai tham số theo công thức sau: p(Y s =1|y (s) ) = 10 0 (( ) (1) 4 ) s aan a φ +− Trong đó hàm n s (1) số các giá trị y t = 1, t~s, rõ ràng hàm này chỉ nhận 5 giá trị {0,1,2,3,4}. Và tương ứng với mỗi giá trị của n s (1), giá trị p(Ys=1|y (s) ) có thể thiết lập được từ ảnh mẫu, có nghĩa chúng ta phải chỉ ra 5 biểu thức tuyến tính để tính a 0 và a 1 . Kết quả a 0 =3,76 và a 1 =3,94. Bây giờ các tham số đã có, nhiệm vụ cuối cùng cho một ảnhmàu x tìm ảnh y nhị phân, với màu trắng là da, màu đen không phải là da. 3.5. Nhậndạngmàuda Với một ảnh đầu vào, nhậndạngmàuda yêu cầu phải tính p(y s |x) là xác suất tại pixel s là màu da. Với môhình Baseline, chỉ cần thay y s =1, x s vào (1), có thể tính được xác suất giá trị màu x s là màu da. Đối với HMM, tính công thức (2) không phải là dễ dàng vì hàm Z không cố định, thay vào đó chúng ta sử dụng thuật toán lấy mẫu Gibbs, lấy dãy tuần tự mẫu sau: y 1 , y 2 ,…, y n0 ,…,y n với phân phối bất biến p(y|x). Sau đó tính trung bình, p(ys|x) được tính bằng - 52 - 0 () 0 1 1 n j s jn y nn =+ − ∑ 4. Thực nghiệm Xây dựng hai môhình Baseline và HMM để kiểm thử khả năng nhậndạngmàuda thì thấy, khả năng nhậndạng của HMM tốt hơn Baseline. 5. Định hướng phát triển HMM có khả năng nhậndạng tốt hơn Baseline, tuy nhiên do phải lấy mẫu, tốc độ phụ thuộc vào kích thước ảnh, cỡ mẫu nên tốc độ chậm hơn nhiều so với Baseline. Nhiệm vụ sắp tới: Cải thiện tốc độ tính toán bằng cách giảm kích cỡ ảnh mà không ảnh hưởng tới nhậndạng hoặc có thể giảm số chiều của không gian màu RGB. Cải thiện khả năng nhận dạng; ở đây, chúng ta chỉ mới áp đặt ràng buộc cho khả năng xuất hiện màuda của hai điểm lân cận, thực tế vùng da còn xuất hiện theo từng nhóm màu… Áp dụng vào nhậndạngảnh khiêu dâm. - 53 - . dựng hai mô hình nhận dạng màu da ảnh màu với ràng buộc lấy từ tập cơ sở dữ liệu Compaq. Mỗi mô hình sử dụng entropy cực đại, mô hình đầu tiên là mô hình Baseline,. cho một ảnh màu x tìm ảnh y nhị phân, với màu trắng là da, màu đen không phải là da. 3.5. Nhận dạng màu da Với một ảnh đầu vào, nhận dạng màu da yêu cầu