1. Trang chủ
  2. » Tất cả

Nâng cao chất lượng ảnh màu mặt người bởi SVD của DCT trong miền Logarit ứng dụng trong hệ thống nhận dạng mặt người

8 7 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 8
Dung lượng 1,79 MB

Nội dung

KHOA HỌC CÔNG NGHỆ P-ISSN 1859-3585 E-ISSN 2615-9619 NÂNG CAO CHẤT LƯỢNG ẢNH MÀU MẶT NGƯỜI BỞI SVD CỦA DCT TRONG MIỀN LOGARIT ỨNG DỤNG TRONG HỆ THỐNG NHẬN DẠNG MẶT NGƯỜI COLOR FACE IMAGE ENHANCEMENT BASED ON SVD OF DCT COEFFICIENTS IN LOGARITHM DOMAIN Nguyễn Nam Phúc1,*, Nguyễn Quốc Trung2, Hà Hữu Huy3 TÓM TẮT Trong báo này, đưa phương pháp cân ánh sáng hữu hiệu để nâng cao chất lượng ảnh mặt người không gian màu RGB ứng dụng nhận dạng mặt người Trước tiên, ảnh mặt người không gian màu RGB phân tách thành ba kênh màu tham chiếu Gaussian biến đổi sang miền logarit Sau sử dụng biến đổi Cosin rời rạc để xác định thành phần tần số thấp mang thông tin độ sáng ảnh mặt người Các hệ số bù sáng tương ứng với ba kênh màu RGB tính tốn cách tự động thơng qua tỉ lệ giá trị riêng lớn ma trận hệ số biến đổi Cosin rời rạc, tần số thấp ba kênh màu tham chiếu Gaussian Kết thử nghiệm hai sở liệu màu tiếng CMU-PIE FERET cho thấy, ảnh khuôn mặt người thu không rõ hơn, lấy lại màu da người tự nhiên, ứng dụng nhiều lĩnh vực thị giác máy tính, mà cịn nâng cao hiệu suất hệ thống nhận dạng mặt người, tốt phương pháp ASVD TSVD Từ khóa: Biến đổi cosin rời rạc (DCT), phân rã giá trị riêng (SVD), nhận dạng ảnh mặt người ABSTRACT In this paper, we provided an effective illumination compensation method to improve the quality of human face images in RGB color space for face recognition First, three color channels of color face image and Gaussian reference are converted to the logarithm domain by logarithm transform (LT), then using the discrete cosine transform (DCT) to determine their low-frequency components The compensated factors corresponding to the three RGB color channels will be calculated automatically through the ratio of the largest singular values of the low-frequency DCT coefficient matrices of the three color channels and the Gaussian reference Experimental results on two databases, namely CMU-PIE and Color FERET show that our method can improve the performance of the face recognition system, better than relevant studies such as ASVD and TSVD Từ khóa: Discrete cosine transform (DCT), Singular Value Decomposition (SVD), face recognition Cục Công nghệ thông tin, Bộ Công an Trường Đại học Bách khoa Hà Nội Viện Khoa học Công nghệ Quân *Email: phucnguyenh46@gmail.com Ngày nhận bài: 12/7/2019 Ngày nhận sửa sau phản biện: 15/8/2019 Ngày chấp nhận đăng: 15/10/2019 20 Tạp chí KHOA HỌC & CÔNG NGHỆ ● Số 54.2019 GIỚI THIỆU Trong năm gần đây, nhận dạng khuôn mặt người trở thành lĩnh vực nghiên cứu quan trọng lĩnh vực nhận dạng mẫu, thị giác máy tính, học máy, hình sự, camera giám sát Tuy nhiên, cịn nhiều yếu tố tác động khơng nhỏ tới độ xác hệ thống nhận dạng mặt người độ sáng, biểu khuôn mặt, tư khn mặt, tác động độ sáng coi nhân tố quan trọng Dưới điều kiện độ sáng khác nhau, ảnh khn mặt người bị q sáng, q tối, chí bị che khuất tồn phần khuôn mặt Do vậy, việc tăng cường chất lượng ảnh mặt người có ý nghĩa vơ quan trọng bước tiền xử lý, qua nâng cao độ xác hệ thống nhận dạng mặt người Nhiều nhà nghiên cứu đưa nhiều phương pháp nâng cao chất lượng ảnh khác nhau, chủ yếu tập trung vào hai loại chính: bù độ sáng ảnh mặt người, qua làm cho ảnh rõ nét loại bỏ tác động độ sáng, qua thu ảnh chứa đặc trưng cấu trúc khn mặt người Nhóm thứ bao gồm phương pháp cân ánh sáng ảnh mặt người Cân lược đồ xám (HE) [1] phương pháp nhằm cân độ tương phản ảnh Tuy nhiên, HE công nghệ xử lý tồn cục nên với ảnh có độ sáng biến thiên cao, kết ảnh sau xử lý không mong đợi Pizer cộng [2] giới thiệu phương pháp mang tên cân lược đồ xám tương thích (AHE) việc tính tốn số lược đồ xám, lược đồ xám tương ứng với phần riêng biệt ảnh sử dụng chúng để phân phối lại giá trị độ sáng ảnh Tuy nhiên, AHE có xu hướng khuếch đại mức Shan cộng [3] đưa phương pháp HE vùng hiệu chỉnh cường độ gamma để điều chỉnh độ sáng tổng thể hình ảnh khn mặt thành hình ảnh khn mặt "chính tắc" xác định trước, đồng thời cho rằng, ảnh mặt người bị che khuất cần cần phải chia thành nhiều ảnh để xử lý Choi Jeong [4] đưa phương pháp để bù vào phần khuôn mặt bị che khuất ảnh mặt người cách sử dụng biến đổi Fourier để biến đổi P-ISSN 1859-3585 E-ISSN 2615-9619 ảnh mặt người từ miền không gian sang miền Fourier, sau cố định phổ pha thay phổ biên độ ảnh mặt người phổ biên độ trung bình tính tốn cách lấy trung bình phổ biên độ ảnh mặt người phổ biên độ trung bình tất ảnh mặt người khác sở liệu Tuy nhiên, khuôn mặt nhận trông không tự nhiên việc thay đổi giá trị phổ biên độ khơng tuyến tính, dẫn đến cấu trúc ảnh nhận khơng với ảnh thực tế Nhóm thứ hai tìm cách loại bỏ cường độ sáng mà giữ lại đặc trưng mang tính cấu trúc khn mặt Zhang cộng [5] định nghĩa độ đo mức nhạy độ sáng tỷ lệ gradient theo hướng ngang hướng dọc thu ảnh cấu trúc khn mặt người gọi gradient face khơng cịn tác động độ sáng cách tính arctangent tỷ lệ Wang cộng [6], Wu cộng [7] thu ảnh mặt người khơng cịn tác động độ sáng dựa luật Weber, ảnh thu gọi weberface Tuy nhiên, phương pháp sử dụng nhiều tham số để xác định ngưỡng mơ hình việc thiết lập giá trị ngưỡng mơ hồ Savvides Kumar [8] sử dụng biên đổi logarit (LT) biến đổi ảnh sang miền logarit, sau sử dụng lọc chuẩn dựa biến đổi contourlet để thu ảnh bất biến với độ sáng Chen cộng [9] sử dụng LT để biến đổi ảnh sang miền logarit, sau sử dụng biến đổi cosin rời rạc (DCT) để xác định tần số thấp tần số cao ảnh mặt người Dựa tính chất thông tin độ sáng thường nằm băng tần tần số thấp thông tin độ phản xạ nằm băng tần tần số cao, gán giá trị băng tần tần số thấp 0, sử dụng giá trị băng tần tần số cao để tái tạo lại ảnh mặt người bất biến với độ sáng Các phương pháp tập trung giải vấn đề biến đổi độ sáng ảnh khuôn mặt đa mức xám Gần đây, nhiều phương pháp xử lý ảnh khuôn mặt màu Torres cộng [10] rằng, thông tin màu thể số khơng gian màu định có tác dụng lớn nhận dạng khuôn mặt người Để giảm hiệu ứng chiếu sáng lên ảnh màu, Demirel Anbarjafari [11] sử dụng phân rã giá trị riêng (SVD) để bù sáng ảnh khuôn mặt màu dựa hệ số bù sáng tính tốn dựa tỷ lệ giá trị riêng lớn tham chiếu Gaussian giá trị riêng lớn kênh màu Tuy nhiên, phương pháp sử dụng hệ số bù sáng cho toàn ba kênh màu RGB, dẫn đến thơng tin màu hình ảnh khn mặt Để khắc phục thiếu sót này, Wang cộng [12] đưa phương pháp phân rã giá trị riêng tương thích (ASVD) cách sử dụng thêm giá trị trung bình 03 kênh màu RGB, kết hợp với tỷ lệ giá trị riêng lớn tham chiếu Gaussian với giá trị riêng lớn kênh màu để tính tốn hệ số bù sáng tương ứng Tương tự, Wang cộng [13] đề xuất phương pháp gọi TSVD, trước tiên phân tách ảnh màu thành hai phần, phần chứa thông tin điểm ảnh tối phần mang thông tin điểm ảnh sáng, sau áp dụng ASVD thích hợp hai phần Tuy nhiên, hình SCIENCE - TECHNOLOGY ảnh ASVD TSVD không cải tiến nhiều ảnh mặt người có độ biến thiên cao Trong báo này, đưa phương pháp hữu hiệu để bù sáng cho ảnh mặt người không gian màu RGB, đặc biệt ảnh bị che khuất cách tính tốn hệ số bù qua việc tham chiếu đến ảnh màu có phân bố chuẩn Gaussian (tham chiếu Gaussian) có kích thước Trước tiên, ảnh mặt người không gian màu RGB tham chiếu Gaussian biến đổi sang miền logarit biến đổi Logarit (LT), sau sử dụng biến đổi DCT để xác định thành phần tần số thấp mang thông tin độ sáng ảnh mặt người Các hệ số bù sáng tương ứng với ba kênh màu RGB tính tốn cách tự động thơng qua tỉ lệ giá trị riêng lớn ma trận hệ số DCT kênh màu tham chiếu Gaussian Kết thử nghiệm hai sở liệu màu tiếng CMU-PIE FERET cho thấy, ảnh khuôn mặt người thu không rõ hơn, lấy lại màu da người tự nhiên, ứng dụng nhiều lĩnh vực thị giác máy tính, mà cịn nâng cao hiệu suất hệ thống nhận dạng mặt người Bố cục báo bố trí sau: Phần giới thiệu tổng quan phương pháp nâng cao chất lượng ảnh mặt người Phần giới thiệu ứng dụng LT, DCT SVD ảnh mặt người Phần trình bày phương pháp nâng cao chất lượng ảnh mặt người không gian màu RGB kết luận trình bày phần BIẾN ĐỔI LOGARIT, BIẾN ĐỔI COSIN RỜI RẠC, PHÂN RÃ GIÁ TRỊ RIÊNG CỦA ẢNH 2.1 Biến đổi Logarit Biến đổi Logarit sử dụng để mở rộng rãi lĩnh vực xử lý ảnh, đặc biệt toán nâng cao chất lượng ảnh [14] Do tính chất hàm logarit với đồ thị biểu diễn hình 1, LT ánh xạ khoảng hẹp giá trị cấp xám thấp ảnh đầu vào thành khoảng rộng ảnh đầu ngược lại biến khoảng rộng giá trị cấp xám cao ảnh đầu vào thành khoảng hẹp giá trị cấp xám ảnh đầu Hình Đồ thị hàm y = log(x) với x chạy từ đến 255 Trong báo này, sử dụng LT để mở rộng giá trị điểm ảnh tối ảnh màu nén giá trị màu cao lại, qua nâng cao chất lượng ảnh mặt người¸ đặc biệt với ảnh màu mặt người No 54.2019 ● Journal of SCIENCE & TECHNOLOGY 21 KHOA HỌC CÔNG NGHỆ P-ISSN 1859-3585 E-ISSN 2615-9619 trường hợp bị che khuất, nâng cao chất lượng ảnh màu khn mặt người Hình biểu diễn số ảnh màu mặt người sở liệu CMU-PIE FERET (a) ảnh thu sau sau sử dụng LT (b) Kết cho thấy, phần bị che khuất ảnh khuếch đại làm cho rõ Tuy nhiên, phần không bị che khuất bị khuếch đại làm cho ảnh bị sáng, ảnh hưởng lớn độ xác hệ thống nhận dạng khuôn mặt (a) (b) Hình Ảnh màu mặt người sở liệu CMU-PIE FERET (a) ảnh thu sau sử dụng LT (b) 2.2 Biến đổi cosin rời rạc Biến đổi cosin rời rạc biến đổi ảnh từ miền không gian sang miền tần số, tập trung lượng vào hệ số, áp dụng rộng rãi nén ảnh số chuẩn JPEG MPEG [15] Các dạng DCT chia thành loại, ký hiệu DCT-I, DCT-II, DCT-III DCT-IV DCT-II sử dụng rộng rãi mã hóa tín hiệu số gần tương đương biến đổi Karhunen-Loeve mơ hình tín hiệu Markov-I với hệ số tương quan gần [16] Trong xử lý ảnh, DCT-II sử dụng rộng rãi thường gọi vắn tắt DCT Cho ảnh xám có kích thước m × n, biến đổi hai chiều DCT (2D-DCT) định nghĩa sau: C(u,v) = α(u)α(v) ∑ ∑ f(x, y)cos ( ) cos ( ) × áp dụng DCT cho khối cách riêng rẽ Trong khuôn khổ nghiên cứu này, chúng tơi áp dụng DCT tồn ảnh thể thu tất thành phần tần số ảnh mặt người Hơn nữa, ảnh khuôn mặt người, độ sáng thường thay đổi chậm so sánh với độ phản xạ, ngoại trừ phần khuôn mặt bị che khuất Khi biến đổi sang miền tần số, thông tin chứa độ sáng thường nằm băng tần tần số thấp thông tin chứa độ phản xạ thường nằm tần số cao Nếu muốn tác động vào độ sáng, tác động vào giá trị băng tần thấp loại bỏ giá trị băng tần cao, ngược lại, ta muốn sử dụng độ phản xạ để biểu diễn ảnh khuôn mặt người, tác động vào băng tần cao loại bỏ giá trị băng tần thấp Kết DCT chuyển đổi ảnh gốc sang miền tần số Giá trị bên trái lưu trữ "biên độ" tần số tần số "cơ sở" tăng dọc theo trục ngang dọc Kết DCT thường tập hợp biên độ tần số thấp bình thường (góc phần tư bên trái) mục nhỏ tần số cao Do thông tin độ sáng nằm chủ yếu băng tần thấp, tái tạo lại ảnh khuôn mặt việc sử dụng hệ số băng tần thấp, gán hệ số băng tần cao Hình cho thấy đắn khẳng định Hàng thứ biểu diễn ảnh mặt người ma trận hệ số DCT tương ứng; hàng ảnh mặt người xây dựng lại giữ lại số thành phần tần số thấp (góc phần mười sáu bên trái) hệ số khác gán 0; hàng ảnh mặt người xây dựng lại giữ lại số thành phần tần số thấp (góc phần tư bên trái) cịn hệ số khác gán 0; hàng ảnh mặt người xây dựng lại gán thành phần tần số thấp (góc phần tám bên trái) hệ số khác giữ nguyên Kết cho thấy, ảnh mặt người trì ta giữ lại thành phần tần số thấp ngược lại ta thu cấu trúc ảnh loại bỏ tần số thấp giữ lại tần số cao (1) đó, C(u, v) gọi hệ số cosin rời rạc Và biến đổi DCT ngược (iDCT) định nghĩa f(x,y) = ∑ ∑ α(u)α(v)C(u, v)cos ( ) cos ( ) (2) với ( )= √ √ , =0 , = 1,2, … , −1 (3) α(v) = √ √ , v=0 , v = 1,2, … , n − (4) Trong chuẩn nén ảnh JPEG, ảnh gốc chia thành khối nhỏ khơng chồng khít lên có kích thước 22 Tạp chí KHOA HỌC & CƠNG NGHỆ ● Số 54.2019 Hình Từ trái qua phải ảnh mặt người, ma trận hệ số DCT lược đồ histogram ảnh mặt người SCIENCE - TECHNOLOGY P-ISSN 1859-3585 E-ISSN 2615-9619 Trong nghiên cứu này, thực việc bù sáng ảnh màu mặt người, loại bỏ tần số cao, giữ lại giá trị tần số thấp (góc phần tư bên trái) đưa thuật toán hữu hiệu để bù sáng cho ảnh màu mặt người, làm cho ảnh khuôn mặt người không rõ hơn, mà tái tạo lại da tự nhiên khn mặt người, qua nâng cao hiệu xuất hệ thống nhận dạng khuôn mặt người Việc làm giống việc sử dụng lọc băng tần thấp miền DCT 2.3 Phân rã giá trị riêng Phân rã giá trị riêng sử dụng rộng rãi xử lý ảnh cấu trúc ảnh số giống ma trận Khơng làm tính tổng quát, giả sử f ảnh mặt người có kích thước M × N, (M  N) SVD ảnh f tính sau: f= U∗Σ∗V ; (5) đó, U = [u , u , … , u ] V = [v , v , … , v ] ma trận trực giao chứa véctơ riêng; Σ = [D, O] gồm giá trị riêng xếp theo chiều giảm dần, với D= diag (1, 2,… , k) giá trị riêng k hạng f Khi ảnh phân rã SVD, giá trị riêng chứa thơng tin độ sáng ảnh số, cịn véctơ riêng chứa thơng tin độ phản xạ Hình biểu diễn 02 ảnh sở liệu CMU-PIE ảnh chúng thu sau gán giá trị riêng ảnh Từ công thức (5) cho thấy, gán ma trận Σ ma trận đơn vị, ảnh thu khơng cịn tác động ma trận Σ Sau loại bỏ tác động giá trị riêng, ta thu ảnh cấu trúc khn mặt khơng cịn tác động độ sáng Điều khẳng định, giá trị riêng mang thông tin độ sáng ảnh Không vậy, giá trị riêng lớn ảnh chứa 99,72% lượng ảnh [18] Hình Ảnh mặt người ảnh tái tạo gán tất giá trị riêng NÂNG CAO CHẤT LƯỢNG ẢNH MẶT NGƯỜI TRONG KHÔNG GIAN MÀU RGB Trong phần này, giới thiệu phương pháp hữu hiệu để nâng cao chất lượng ảnh mặt người không gian màu RGB, qua nâng cao độ xác hệ thống nhận dạng khuôn mặt người Một ảnh có chất lượng tốt thường có độ phân phối gần phân phối chuẩn tắc, gọi phân bố Gaussian, phân phối chuẩn với giá trị trung bình μ độ lệch chuẩn σ Do vậy, phương pháp tham chiếu đến ảnh có phân phối Gaussian để tính toán hệ số bù sáng cho kênh màu ảnh màu mặt người, qua tự động điều chỉnh kênh màu có độ phân bố gần với phân bố chuẩn tắc, nâng cao chất lượng ảnh Do giá trị điểm ảnh nằm khoảng giá trị từ đến 255 nên ảnh có phân phối chuẩn tắc có giá trị trung bình μ 32 độ lệch chuẩn σ 128 Ta ký hiệu ảnh có phân phối chuẩn tắc Ga, biểu diễn hình Trước tiên, phân tách ảnh mặt người không gian màu RGB thành kênh màu R, G, B riêng biệt Ký hiệu ảnh mặt f, ta có: f = {R, G, B}; (6) Hình Ảnh phân phối chuẩn tắc Gaussian lược đồ xám Tiếp theo, sử dụng LT để biến đổi kênh màu sang miền logarit Như thảo luận phần 2.1, LT có vai trị lớn việc nâng cao chất lượng ảnh bị che khuất Ký hiệu f = LT(f) Ga = LT(Ga), ta có: f = log(f) = log({R, G, B}) = {R , G , B } (7) Ga = log(Ga) ; (8) Để xác định thành phần tần số thấp mang thông tin độ sáng, sử dụng DCT để biến đổi kênh màu miền logarit sang miền DCT Như thảo luận phần 2.2 tần số thấp miền DCT chứa thông tin độ sáng, giữ lại thành phần tần số thấp (góc phần tư bên trái) kênh màu, ký hiệu DCT_R , DCT_G , DCT_B , có kích thước 1/4 ảnh gốc (dịng hình 3) tương ứng với kênh màu R, G, B tác động vào hệ số để thu ảnh có chất lượng tốt Ta có: {DCT_R , DCT_G , DCT_B } = DCT(R , G , B ) (9) DCT_Ga = DCT(Ga ) (10) Như thảo luận phần 2.3, giá trị riêng ảnh chứa thông tin độ sáng giá trị riêng lớn chứa 99,72% lượng ảnh, tính tốn SVD DCT_RLT DCT_G , DCT_B DCT_Ga : DCT_R = U ∗ Σ ∗ V ; (11) DCT_G = U ∗ Σ ∗ V ; (12) DCT_B = U ∗ Σ ∗ V ; (13) DCT_Ga = U ∗ Σ ∗ (14) Ký hiệu giá trị riêng lớn Σ , Σ , Σ Σ tương ứng λ , λ , λ λ Khi đó, hệ số bù sáng cho kênh màu tính sau: μ = (15) μ = (16) μ = (17) (a) No 54.2019 ● Journal of SCIENCE & TECHNOLOGY 23 KHOA HỌC CƠNG NGHỆ (b) Hình Ảnh màu mặt người lược đồ histogram (a); ảnh ALDS ảnh gốc hàng lược đồ histogram ALDS (b) Thông qua hệ số bù sáng này, cách hệ số DCT tính tốn lại cách nhân với hệ số bù sáng sau: DCT_R ù = U ∗ (μ Σ ) ∗ V ; (18) DCT_G ù = U ∗ (μ Σ ) ∗ V ; (19) DCT_B ù = U ∗ (μ Σ ) ∗ V ; (20) Sử dụng biến đổi DCT ngược hệ số DCT bù sáng, ta kênh màu sau bù sáng: R ù = iDCT(DCT_R ù ); (21) G ù = iDCT(DCT_G ù ); (22) B ù = iDCT(DCT_B ù ); (23) Cuối cùng, trộn lẫn ba kênh màu chuẩn hóa liệu, ta thu ảnh màu mặt người, ký hiệu ALDS, không rõ nét nhiều so với ảnh gốc, mà cịn tái tạo lại mầu da người, hữu hiệu lĩnh vực thị giác máy tính phát màu da, hình Do bề mặt người bề mặt khuếch tán hoàn hảo (bề mặt lambertian) nên số trường hợp, có đặc trưng khn mặt không nằm băng tần thấp Hơn nữa, phần bị che khuất nằm băng tần với đặc trưng quan trọng khn mặt, có lúc độ sáng khơng bù bỏ tần số cao Do vậy, nghiên cứu này, không dùng biến đổi logarit ngược Hình cho ta thấy, ảnh màu mặt người ALDS rõ nét hơn, màu da với tự nhiên có phân bố giá trị độ sáng gần với phân bố chuẩn tắc Do vậy, nâng cao hiệu suất hệ thống nhận dạng khuôn mặt người KẾT QUẢ THỰC NGHIỆM Để làm rõ hiệu phương pháp ALDS, tiến hành thực nghiệm hai sở liệu ảnh màu tiếng CMU-PIE [19] FERET [20] Chúng so sánh kết ALDS với phương pháp trước ASVD, TSVD ảnh màu mặt người thu việc sử dụng LT, ký hiệu CFLT, thảo luận phần 2.1 Để tiến hành so sánh, chúng tơi sử dụng phương pháp trích xuất đặc trưng khuôn mặt để tiến hành nhận dạng khác Eigenface [21] LBP [22] 4.1 Thực nghiệm sở liệu CMU-PIE Cơ sở liệu mặt người CMU-PIE bao gồm 41.368 ảnh màu 68 người Mỗi người chụp 13 tư thế, 43 cường độ sáng, sắc thái khuôn mặt khác Để thực nghiệm kết quả, người lấy 45 ảnh chụp trực diện, ảnh có độ sáng khác chụp máy ảnh trung tâm (c27), bao gồm hai điều kiện "tắt đèn" "bật 24 Tạp chí KHOA HỌC & CƠNG NGHỆ ● Số 54.2019 P-ISSN 1859-3585 E-ISSN 2615-9619 đèn" Loại "tắt đèn" bao gồm 21 độ sáng từ f02 đến f22, loại "bật đèn" bao gồm 24 độ sáng từ f00 đến f23 hình 7(a) Khn mặt người trích xuất chuẩn hóa kích thước 96×132 Tổng cộng chúng tơi có 3600 ảnh Chúng tơi sử dụng phương pháp ASVD, TSVD, CFLT ALDS để thu ảnh từ ảnh màu mặt người gốc để tiến hành nhận dạng Hình biểu diễn ảnh gốc kết của phương pháp Hình 7(a) biểu diễn 45 ảnh 45 độ sáng khác nhau, điều kiện “tắt đèn” “bật đèn” người sở liệu CMU-PIE Hình 7(b) biểu diễn kết thu sau áp dụng phương pháp ASVD kết phương pháp TSVD biểu diễn hình 7(b) Kết cho thấy, ảnh sau nâng cao khơng q khác biệt so với ảnh gốc phương pháp xử lý ảnh miền không gian Hình 7(c) biểu diễn ảnh thu áp dụng phương pháp CFLT thảo luận mục 2.1 Kết cho thấy, ảnh rõ nét thấy tác động điều kiện “tắt đèn” “bật đèn” Kết phương pháp ALDS chúng tơi biểu diễn hình 7(d) Kết cho thấy, tất ảnh rõ nét hơn, đặc biệt ảnh bị che khuất tái tạo da gốc người, trông tự nhiên Tất ảnh có màu sắc giống chụp thời điểm điều kiện “bật đèn” (a) (b) SCIENCE - TECHNOLOGY P-ISSN 1859-3585 E-ISSN 2615-9619 30 81,13 83,24 83,14 85,15 91,57 40 83,38 85,34 85,25 87,11 93,73 50 84,85 86,91 86,57 88,33 94,80 60 86,13 87,75 87,84 89,22 95,20 70 87,06 88,48 88,58 89,80 95,64 80 87,30 89,07 88,82 90,00 95,98 90 87,79 89,41 89,22 90,20 96,37 100 88,19 89,66 89,51 90,25 96,52 110 88,63 90,00 90,05 90,44 96,72 120 88,82 90,15 90,34 90,69 96,81 Tất 90,05 91,22 91,43 92,42 98,14 (c) (d) (e) Hình (a) 45 ảnh gốc người sở liệu CMU-PIE; (b) ASVD (a); (c) TSVD (a); (d) CFLT (a); (e) ALDS (a) Bảng Kết nhận dạng mặt người sở liệu CMU-PIE phương pháp eigenface Số thành phần Tỉ lệ nhận dạng Ảnh gốc ASVD TSVD CFLT ALDS 10 58,77 63,82 60,39 63,33 74,12 20 75,54 78,73 78,14 80,54 87,60 Hình Tỉ lệ nhận dạng phương pháp eigenface sở liệu CMU-PIE Đầu tiên, sử dụng phương pháp eigenface để đánh giá hiệu suất nhận dạng khuôn mặt Phương pháp eigenface dựa việc ánh xạ tuyến tính ảnh mặt người vào khơng gian đặc trưng có số chiều thấp cách sử dụng phương pháp phân tích thành phần (PCA) Nó sử dụng thành phần véc-tơ riêng tương ứng với giá trị riêng lớn làm đặc trưng sau dùng giải thuật hàng xóm lân cận ảnh huấn luyện ảnh kiểm tra Để tiến hành nhận dạng, với người sở liệu, chọn 15 ảnh để huấn luyện 30 ảnh lại để kiểm tra Kết nhận dạng biểu diễn bảng hình Kết cho thấy, phương pháp ALDS nâng cao đáng kể tỉ lệ nhân dạng mặt người, cao ảnh gốc, ASVD, TSVD, CFLT 8,09%, 6,42%, 6,71% 5,72% Tiếp theo, tiếp tục so sánh tỉ lệ nhận dạng phương pháp ALDS với phương pháp ASVD, TSVD, CFLT phương pháp trích xuất đặc trưng khác phương pháp mẫu nhị phân cục (LBP) Không giống phương pháp eigenface bị ảnh hưởng lớn thay đổi độ sáng Phương pháp LBP loại bỏ thông tin chứa độ sáng thu cấu trúc ảnh khuôn mặt người Hình 9(a) biểu diễn ảnh mặt người gốc ảnh LBP chúng hình 9(b) biểu diễn ảnh ALDS ảnh LBP chúng cho thấy, hình ảnh LBP ALDS rõ ràng Kết nhận dạng LBP bảng cho thấy, sau sử dụng ALDS, tỉ lệ nhận dạng tăng 2,92%, 2,18%, No 54.2019 ● Journal of SCIENCE & TECHNOLOGY 25 KHOA HỌC CÔNG NGHỆ P-ISSN 1859-3585 E-ISSN 2615-9619 1,98% 1,9% so sánh với ảnh gốc, ASVD, TSVD CFLT Điều chứng tỏ, ALDS tăng cường màu sắc ảnh mặt người, mà tăng cường cấu trúc ảnh mặt người Bảng Kết nhận dạng mặt người sở liệu FERET phương pháp LBP Cơ sở liệu Tỉ lệ nhận dạng Ảnh gốc ASVD TSVD CFLT ALDS CMU-PIE 95,08 95,82 96,02 96,10 98 FERET 90,55 90,85 90,85 91,20 94,5 Hình 10 biểu diễn hình ảnh gốc sở liệu FERET hình ảnh ASVD, TSVD, CFLT ALDS Cũng giống sở liệu CMU-PIE, hình ảnh ASVD hàng TSVD hàng khơng có q nhiều khác biệt so với ảnh gốc Tuy nhiên, ảnh CFLT hàng đặc biệt ảnh ALDS hàng cuối cho thấy, tất ảnh độ sáng, qua làm khn mặt người rõ nét Kết nhận dạng eigenface sở liệu FERET biểu diễn bảng hình 12 Kết cho thấy, sau sử dụng ALDS, tỉ lệ nhận dạng tăng 29,5%, 23,5%, 10,5% 1% so sánh với ảnh gốc, ASVD, TSVD CFLT (a) (b) Hình Ảnh thu áp dụng phương pháp LBP (a) Ảnh gốc LBP ảnh gốc; (b) Ảnh ALDS LBP chúng 4.2 Thực nghiệm sở liệu FERET Để kiểm tra thêm khả nhận dạng khuôn mặt ALDS, sử dụng phương pháp eigenface LBP để đánh giá hiệu suất nhận dạng khuôn mặt sở liệu FERET Cơ sở liệu FERET đưa Viện Tiêu chuẩn Công nghệ Quốc gia Mỹ (NIST), gồm 11.338 ảnh thu thập từ 994 người với nhiều sắc thái khuôn mặt nhiều độ sáng khác Để tiến hành thực nghiệm, chọn 810 người sở liệu, người gồm 02 ảnh tập fa fb biểu diễn hình 10, fa dùng để huấn luyện cịn fb dùng để kiểm tra (a) (b) Hình 10 Ví dụ ảnh fa fb người sở liệu FERET 26 Tạp chí KHOA HỌC & CƠNG NGHỆ ● Số 54.2019 Hình 11 Hàng gồm 05 ảnh FERET; hàng gồm ASVD hàng 1; hàng gồm TSVD hàng 1; hàng gồm CFLT hàng 1; hàng gồm ALDS hàng Bảng Kết nhận dạng mặt người sở liệu FERET phương pháp eigenface Số thành phần Tỉ lệ nhận dạng Ảnh gốc ASVD TSVD CFLT ALDS 10 50,0 49,0 69,0 70,5 72,0 20 60,0 60,0 76,5 79,0 82,5 30 61,5 65,5 80,0 80,0 86,5 40 65,0 69,5 81,0 84,0 90,0 50 65,5 70,5 82,5 85,0 92,5 60 65,5 71,0 83,5 84,5 93,5 70 66,0 71,5 83,5 84,0 94,0 80 66,0 71,5 84,5 85,0 96 90 66,0 71,5 85,0 85,5 96,5 100 67,5 73,0 84,5 87,0 96,0 110 67,5 73,0 85,0 87,5 96,0 120 67,5 73,0 85,5 87,5 96,5 Tất 68,5 74,5 87,5 88,0 98,0 P-ISSN 1859-3585 E-ISSN 2615-9619 Hình 12 Tỉ lệ nhận dạng phương pháp eigenface sở liệu FERET Kết nhận dạng LBP tập liệu FERET bảng cho thấy, sau sử dụng ALDS, tỉ lệ nhận dạng tăng 3,95%, 3,65%, 3,65% 3,3% so sánh với ảnh gốc, ASVD, TSVD CFLT KẾT LUẬN Trong báo này, phương pháp tiền xử lý hình ảnh có tên ALDS đề xuất để nhận dạng khuôn mặt màu nhiều độ sáng khác Phương pháp làm cho hình ảnh khn mặt màu rõ hơn, tự nhiên mịn hơn, hình ảnh khuôn mặt bị che khuất Các kết thử nghiệm dựa hai sở liệu màu mặt phổ biến CMU-PIE FERET cho thấy, phương pháp đề xuất hiệu ứng dụng thực tế Phương pháp cho thấy hiệu suất cao cho tác vụ khớp khuôn mặt chắn hữu ích lĩnh vực thị giác máy tính, phát khn mặt phát màu da TÀI LIỆU THAM KHẢO [1] R C Gonzalez and R E Wood, 2007 Digital image processing third ed Prentice Hall [2] S M Pizer, E P Amburn, J D Austin, R Cromartie, A Geselowitz, T Greer, B T H Romeny, J B Zimmerman, and K Zuiderveld, 1987 Adaptive histogram equalization and its variations Comput Vision Graph Image Process., vol 39, pp 355-368 [3] S Shan, W Gao, B Cao, and D Zhao, 2003 Illumination normalization for robust face recognition against varying lighting conditions in IEEE Workshop on AMFG, pp.157-164 [4] S -I Choi and G -M Jeong, 2011 Shadow compensation using Fourier analysis with application to face recognition IEEE Signal Process Lett., vol 18, pp 23-26 [5] T Zhang, Y Y Tang, B Fang, Z Shang and X Liu, 2009 Face recognition under varying illumination using Gradientfaces IEEE Trans Image Process., vol 18, pp 2599-2606 [6] B Wang, W Li, W Yang and Q Liao, 2011 Illumination normalization based on Weber's law with application to face recognition IEEE Signal Process Lett, vol 18, pp 462–465 SCIENCE - TECHNOLOGY [7] Y Wu, Y Jiang, Y Zhou, W Li, Z Lu, and Q Liao, 2014 Generalized Weber-face for illumination-robust face recognition Neurocomputing, vol 136, pp 262-267 [8] M Savvides and B V K V Kumar, 2003 Illumination normalization using logarithm transforms for face authentication in Proc IAPR AVBPA, pp 549556 [9] W Chen, M J Er, and S Wu, 2006 Illumination compensation and normalization for robust face recognition using discrete cosine transform in logarithm domain IEEE Trans Syst., Man, Cybern.,Syst, vol 36, pp 458-466 [10] L Torres, J Y Reutter, and L Lorente, 1999 The importance of the color information in face recognition Int Conf ICIP, vol 3, pp 627-631 [11] H Demirel and G Anbarjafari, 2008 Pose invariant face recognition using probability distribution functions in different color channels IEEE Signal Process Lett, vol 15, pp 537-540 [12] J -W Wang, J -S Lee, and W -Y Chen, 2011 Face recognition based on projected color space with lighting compensation IEEE Signal Process Lett, vol 18, pp 567-570 [13] J -W Wang, J -S Lee, and W -Y Chen, 2014 Recognition based on two separated singular value decomposition-enriched faces Journal of Electronic Imaging, vol 23, no 6, pp 063010-1~063010-15 [14] Y Adini, Y Moses, and S Ullman, 1997 Face recognition: the problem of compensating for changes in illumination direction IEEE Trans Pattern Anal Mach Intell., vol 19, no 7, pp 721–732 [15] W Pennebaker and J Mitchell, 1993 JPEG Still Image Data Compression Standard New York: Van Nostrand Reinhold [16] K R Rao and P Yip, 1990 Discrete Cosine Transform: Algorithms, Advantages, Applications Boston, MA: Academic [17] H Demirel and G Anbarjafari, 2008 Pose invariant face recognition using probability distribution functions in different color channels IEEE Signal Process Lett, vol 15, pp 537-540 [18] T Sim, S Baker, and M Bsat, 2003 The CMU pose, illumination, and expression database IEEE Trans Pattern Anal Mach Intell., vol 25, pp 16151618 [19] P J Phillips, H Moon, S.A Rizvi, P.J Rauss, 2000 The FERET evaluation methodology for face recognition algorithms IEEE Trans Pattern Anal Mach Intell., vol 22, pp 1090-1104 [20] P N Belhumeur, J P Hespanha, and D J Kriegman, 1997 Eigenfaces vs Fisherfaces: Recognition using class specific linear projection IEEE Trans Pattern Anal Mach Intell., vol 19 [21] T Ahonen, A Hadid, and M Pietikainen, 2006 Face description with local binary patterns: application to face recognition IEEE Trans Pattern Anal Mach Intell., vol 28, pp 2037-2041, 2006 AUTHORS INFORMATION Nguyen Nam Phuc1, Nguyen Quoc Trung2, Ha Huu Huy3 Department of Information Technology, Ministry of Public Security of Socialist Republic of Vietnam Hanoi University of Science and Technology Military Institute of Technology and Science, Vietnam No 54.2019 ● Journal of SCIENCE & TECHNOLOGY 27 ... cịn nâng cao hiệu suất hệ thống nhận dạng mặt người Bố cục báo bố trí sau: Phần giới thiệu tổng quan phương pháp nâng cao chất lượng ảnh mặt người Phần giới thiệu ứng dụng LT, DCT SVD ảnh mặt người. .. giới thiệu phương pháp hữu hiệu để nâng cao chất lượng ảnh mặt người khơng gian màu RGB, qua nâng cao độ xác hệ thống nhận dạng khn mặt người Một ảnh có chất lượng tốt thường có độ phân phối gần... Không vậy, giá trị riêng lớn ảnh chứa 99,72% lượng ảnh [18] Hình Ảnh mặt người ảnh tái tạo gán tất giá trị riêng NÂNG CAO CHẤT LƯỢNG ẢNH MẶT NGƯỜI TRONG KHÔNG GIAN MÀU RGB Trong phần này, giới thiệu

Ngày đăng: 05/05/2021, 18:10

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w