Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 49 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
49
Dung lượng
5,7 MB
Nội dung
ĐẠI HỌC QUỐC GIA TP HCM TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN DƯƠNG HỮU PHƯỚC XÂY DỰNG HỆ THỐNG NHẬN DẠNG THUỘC TÍNH MẶT NGƯỜI DỰA VÀO MẠNG HỌC SÂU TÍCH CHẬP LUẬN VĂN THẠC SĨ NGÀNH KHOA HỌC MÁY TÍNH MÃ SỐ: 60.48.01.01 Người hướng dẫn khoa học: PGS TS Dương Anh Đức PGS TS Lý Quốc Ngọc TP HỒ CHÍ MINH – Năm 2018 LỜI CÁM ƠN Trước tiên, em xin gửi lời cảm ơn chân thành đến thầy PGS TS Dương Anh Đức thầy PGS TS Lý Quốc Ngọc Trong suốt trình làm luận văn, hai thầy dành nhiều thời gian, công sức để hướng dẫn giúp đỡ em tận tình để em hồn tất để tài cách thuận lợi Bên cạnh đó, em xin cảm ơn thầy cô trường Đại học Công nghệ Thông tin, Đại học Quốc gia Tp.HCM, đặc biệt thầy Lê Đình Duy thầy Nguyễn Tấn Trần Minh Khang, thầy cô MMLab tạo điều kiện cho em học tập, nghiên cứu hoàn tất luận văn Em xin cảm ơn anh chị đồng nghiệp đơn vị công tác hỗ trợ em suốt trình thực luận văn Em xin chân thành cảm ơn Tp.HCM, tháng 12 năm 2017 Dương Hữu Phước i LỜI CAM ĐOAN Tôi xin cam đoan cơng trình nghiên cứu riêng tơi Các số liệu, kết nêu luận văn trung thực chưa công bố cơng trình nghiên cứu khác, ngoại trừ tư liệu trích dẫn liệt kê mục Tài liệu tham khảo Tác giả luận văn Dương Hữu Phước ii MỤC LỤC DANH MỤC HÌNH v DANH MỤC BẢNG vi DANH MỤC TỪ VIẾT TẮT vii Chương 1: Giới thiệu 1 Động lực nghiên cứu Phát biểu toán Thách thức mục tiêu Đóng góp luận văn Cấu trúc luận văn Chương 2: Các cơng trình nghiên cứu liên quan Bài báo “Deep Learning Face Attributes in the Wild” Bộ nhận dạng khuôn mặt sử dụng Deep Learning 11 Bảng thống kê cơng trình nghiên cứu liên quan 14 Chương 3: Mơ hình học thuộc tính mặt người dựa mạng học sâu 19 Framework hệ thống nhận dạng mặt người dựa thuộc tính 19 Đề xuất cải tiến module nhận dạng thuộc tính khn mặt 20 Cách tổ chức, phân loại thuộc tính 22 Kiến trúc mạng AlexNet [25] 23 Kiến trúc mạng VGG-16 [8] 23 Chương 4: Thực nghiệm đánh giá 26 Bộ liệu huấn luyện thử nghiệm: CelebA 26 Bộ liệu huấn luyện thử nghiệm: LFWA 30 iii Các thiết lập thí nghiệm 32 Các kết thí nghiệm 33 Chương 5: Kết luận hướng phát triển 38 Kết luận 38 Hướng phát triển 38 Tài liệu tham khảo 39 iv DANH MỤC HÌNH Hình 1.1 Minh họa hệ thống nhận dạng thích thuộc tính cho mặt người Hình 2.1 DL Framework dùng việc nhận dạng thuộc tính khn mặt [4] Hình 2.2 Mơ hình DL Framework hình 2.1 Hình 2.3 Mô việc sử dụng phân lớp SVM để dự đốn thuộc tính [10] 13 Hình 2.4 So sánh độ xác CNN so với descriptor truyền thống [10] 14 Hình 2.5 Độ xác trung bình CNN so với phân lớp truyền thống 14 Hình 3.1 Framework hệ thống nhận dạng mặt người dựa thuộc tính 19 Hình 3.2 Ví dụ kết sau nhận dạng thành phần khuôn mặt 20 Hình 3.3 Cấu trúc mạng AlexNet [25] 23 Hình 3.4 Kiến trúc mạng VGG-16 [8] 24 Hình 4.1 Sơ đồ cấu trúc thư mục liệu CelebA 27 Hình 4.2 Một số ảnh mẫu kèm theo thuộc tính liệu CelebA 29 Hình 4.3 Một số ảnh mẫu liệu LFW 31 Hình 4.4 Biểu đồ độ xác thuộc tính AlexNet VGG-16 35 Hình 4.5 Biểu đồ độ xác thuộc tính AlexNet VGG-16 37 v DANH MỤC BẢNG Bảng 2.1 Một số thử nghiệm tập liệu CelebA LFWA [4] Bảng 2.2 Một số thử nghiệm tập liệu CelebA LFWA [4] (tt) 10 Bảng 2.3 Một số thử nghiệm tập liệu CelebA LFWA [4] (tt) 11 Bảng 2.4 Số ảnh huấn luyện từ tập liệu LFW [10] 12 Bảng 2.5 So sánh cơng trình nghiên cứu liên quan 15 Bảng 3.1 Phân loại thuộc tính theo nhóm 22 Bảng 3.2 Thông số chi tiết mạng VGG-16 25 Bảng 4.1 Danh sách thuộc tính liệu CelebA 29 Bảng 4.2 Danh sách thuộc tính liệu LFWA 30 Bảng 4.3 Tên mạng CNN tương ứng với nhóm thuộc tính 32 Bảng 4.4 Cấu hình máy học thử nghiệm 33 vi DANH MỤC TỪ VIẾT TẮT FAD: Facial Attribute Detection DL: Deep Learning ML: Machine Learning SIFT: Scale-Invariant Feature Transform HOG: Histogram of Oriented Gradients CNN: Convolutional Neural Network vii Chương 1: Giới thiệu Động lực nghiên cứu Trong lĩnh vực Thị giác máy tính nói riêng Khoa học máy tính nói chung, việc “dạy” cho máy tính “nhìn” “hiểu” khái niệm mục tiêu cốt lõi Tuy nhiên có khái niệm khó để học, ngược lại học khái niệm qua dấu chỉ, đặc tính khái niệm dễ dàng nhiều Với khuôn mặt người (coi khái niệm cần học), thuộc tính khn mặt mắt, mũi, miệng, tóc, tai… dấu Việc huấn luyện cho máy tính hiểu khn mặt khó so với việc hiểu dấu đặc trưng thuộc tính khn mặt đơn giản so với đặc trưng khuôn mặt Ngồi ra, lĩnh vực nhận dạng khn mặt tồn đọng nhiều tốn liên quan đến thuộc tính, ví dụ tốn người – n thuộc tính tốn n người – thuộc tính giống Với việc huấn luyện cho máy nhận dạng thuộc tính khn mặt giải tốn trên, đồng thời góp phần vào cơng đoạn lọc liệu nhanh (fast filtering) tập liệu lớn để giảm thời gian truy vấn ảnh Ngoài ra, đa số nhận dạng khuôn mặt gặp khó khăn đối đầu với biểu cảm khác khn mặt, góc chụp khác nhau, ánh sáng, màu sắc ảnh Tuy nhiên, việc áp dụng mạng nơron nhân tạo, cụ thể mạng nơron tích chập (CNN) vào tốn nhận dạng khn mặt cho thấy kết tốt thời gian lẫn hiệu suất Do đó, tác giả muốn áp dụng DL CNN vào tốn nhận dạng thuộc tính khn mặt nhằm đạt kết tốt Bài tốn nhận dạng thích thuộc tính cho mặt người làm tiền đề để cơng trình nghiên cứu sau áp dụng phương pháp Deep Learning vào hệ thống nhận dạng khác nhận dạng đối tượng (object recognition), nhận dạng vật (animal recognition)… Chương 1: Giới thiệu Phát biểu tốn Bài tốn nhận dạng thuộc tính khn mặt (FAD) mô tả sau: Đầu vào ảnh I danh sách thuộc tính Ai mà hệ thống nhận dạng (ví dụ màu tóc, màu mắt, màu da, hình dáng khn mặt, đặc điểm riêng dị nốt ruồi, tàn nhang…), đầu danh sách thuộc tính Aj xuất ảnh, kèm theo bounding box Bj rõ vị trí tương ứng thuộc tính Hệ thống Image I + Attribute Ai:1→n → Attribute Aj { (j ∈ [1, n]) Bounding box Bj Hệ thống nhận dạng thuộc tính mặt người Hình 1.1 Minh họa hệ thống nhận dạng thích thuộc tính cho mặt người Bất kì hệ thống nhận dạng gồm giai đoạn giai đoạn offline (cài đặt hệ thống huấn luyện) giai đoạn online (thử nghiệm) Chương 4: Thực nghiệm đánh giá Dung lượng đầy đủ sau giải nén CelebA khoảng 22 GB, với cấu trúc thư mục sau: list_attr_celeba.txt list_bbox_celeba.txt Anno list_landmarks_align_celeba.txt list_landmarks_celeba.txt list_eval_partition.txt CelebA Eval img_align_celeba Img img_align_celeba_png img_celeba README.txt Hình 4.1 Sơ đồ cấu trúc thư mục liệu CelebA Thư mục Anno chứa file text lưu trữ thơng tin thích cho ảnh: File list_attr_celeba.txt chứa thích cho 40 thuộc tính theo dạng Đúng (1) Sai (-1) 27 Chương 4: Thực nghiệm đánh giá File list_bbox_celeba.txt chứa thích vị trí khung định vị (bounding box) cho mặt người, gồm tọa độ đỉnh góc bên trái kích thước (ngang, dọc) khung định vị File list_landmarks_align_celeba.txt list_landmarks_celeba.txt chứa thích tọa độ phận khn mặt cho ảnh Thư mục Eval chứa file list_eval_partition.txt lưu trữ thông tin trạng thái file ảnh File ảnh có trạng thái dùng cho q trình học (train), trạng thái dùng cho trình đánh giá (validation), trạng thái dùng cho trình thử nghiệm (test) Thư mục Img bao gồm thư mục con, thư mục gồm 202,599 ảnh: Thư mục img_align_celeba chứa liệu với ảnh khuôn mặt cắt bỏ (crop) phần không cần thiết (nền, phận khuôn mặt vai, cổ, ngực…) canh chỉnh góc mặt (align) Kích thước ảnh cố định mức 178 x 218 pixel Định dạng file JPG Thư mục img_align_celeba_png tương tự thư mục định dạng file PNG Thư mục img_celeba chứa liệu gốc Kích thước ảnh không cố định Định dạng file JPG Tập tin README.txt dùng để giải thích cho liệu So sánh ảnh gốc ảnh crop align: Ảnh gốc Ảnh crop align 28 Chương 4: Thực nghiệm đánh giá Danh sách 40 thuộc tính mặt người liệu CelebA: Bảng 4.1 Danh sách thuộc tính liệu CelebA 5_o_Clock_Shadow Arched_Eyebrows Bald Bangs Black_Hair Blond_Hair Bushy_Eyebrows Chubby Goatee Gray_Hair Male Mouth_Slightly_Open No_Beard Oval_Face Receding_Hairline Rosy_Cheeks Straight_Hair Wavy_Hair Wearing_Lipstick Wearing_Necklace Attractive Big_Lips Blurry Double_Chin Heavy_Makeup Mustache Pale_Skin Sideburns Wearing_Earrings Wearing_Necktie Bags_Under_Eyes Big_Nose Brown_Hair Eyeglasses High_Cheekbones Narrow_Eyes Pointy_Nose Smiling Wearing_Hat Young Một số ảnh mẫu liệu CelebA: Hình 4.2 Một số ảnh mẫu kèm theo thuộc tính liệu CelebA 29 Chương 4: Thực nghiệm đánh giá Bộ liệu huấn luyện thử nghiệm: LFWA Bộ liệu LFW (Labeled Face in the Wild) xây dựng cung cấp nhà nghiên cứu Gary B Huang, Manu Ramesh, Tamara Berg, Erik Learned-Miller địa http://vis-www.cs.umass.edu/lfw/index.html Tương tự liệu CelebA, liệu LFW sử dụng cho toán thị giác máy tính liên quan đến mặt người Được cơng bố vào tháng 10/2007, đến có nhiều phiên khác phát triển từ LFW, điển hình phiên LFW-a cải tiến lại LFW cách canh chỉnh lại (align) ảnh khuôn mặt, công bố vào tháng 8/2012, phiên LFWA+ phiên ảnh màu LFW Bộ liệu LFWA gồm có: 5,749 class (tương ứng với 5,749 người khác nhau) 13,233 ảnh grayscale (trong có 1,680 class có ảnh) 73 giá trị thuộc tính khn mặt cho ảnh Dung lượng đầy đủ sau giải nén LFWA khoảng 132 MB Trong thư mục lfw thư mục đặt tên theo class, thư mục file ảnh đặt tên theo cấu trúc name_xxxx.jpg, với name tên class, xxxx số thứ tự file ảnh class đó, gồm chữ số, đánh số Ví dụ: ảnh thứ 10 George W Bush có đường dẫn lfw\George_W_Bush\George_W_Bush_0010.jpg Trong LFWA, file ảnh có kích thước cố định 250 x 250 pixel, định dạng JPG hệ màu grayscale Bộ liệu kèm theo file lfw_attributes.txt ghi lại thuộc tính khn mặt Danh sách 73 thuộc tính gồm có: Bảng 4.2 Danh sách thuộc tính liệu LFWA Male Asian White Black Baby Child Youth Middle Aged Senior Black Hair Blond Hair Brown Hair Bald No Eyewear Eyeglasses Sunglasses Mustache Smiling Frowning Chubby 30 Chương 4: Thực nghiệm đánh giá Blurry Harsh Lighting Flash Curly Hair Wavy Hair Straight Hair Sideburns Fully Visible Forehead Partially Visible Forehead Soft Lighting Receding Hairline Obstructed Forehead Arched Eyebrows Narrow Eyes Eyes Open Big Nose Pointy Nose Big Lips Mouth Closed No Beard Goatee Mouth Slightly Open Round Jaw Mouth Wide Open Double Chin Teeth Not Visible Wearing Hat Oval Face Square Face Attractive Woman Round Face Color Photo Posed Photo Indian Gray Hair Bags Under Eyes Heavy Makeup Rosy Cheeks Shiny Skin Pale Skin o' Clock Shadow Strong NoseMouth Lines Wearing Lipstick Attractive Man Wearing Earrings Wearing Necktie Flushed Face High Cheekbones Wearing Necklace Một số ảnh mẫu liệu LFW: Hình 4.3 Một số ảnh mẫu liệu LFW 31 Outdoor Bangs Bushy Eyebrows Brown Eyes Chương 4: Thực nghiệm đánh giá Các thiết lập thí nghiệm Bộ liệu CelebA cung cấp file list_landmarks_align_celeba.txt cho biết tọa độ (x, y) điểm đặc biệt ảnh (landmark) Trong [4], tác giả liệu CelebA lấy đặc trưng tồn khn mặt Luận văn thử nghiệm cách lấy đặc trưng cục cho phần thuộc tính tương ứng Tác giả sử dụng tọa độ landmark CelebA cung cấp để xác định bounding box cho thành phần khuôn mặt tương ứng lấy đặc trưng bounding box Cuối cùng, so sánh với độ xác báo gốc [4] Mạng CNN sử dụng để học liệu AlexNet VGG-16, có hỗ trợ GPU để tăng tốc độ xử lí Bộ liệu sử dụng để học CelebA LFWA Danh sách thuộc tính trình bày bảng 3.1: Bảng 4.3 Tên mạng CNN tương ứng với nhóm thuộc tính Nhóm thuộc tính Tên mạng Mắt CNN01 (5 nút) Mũi Má CNN02 (5 nút) Miệng Cằm CNN03 (4 nút) Râu CNN04 (3 nút) Tóc CNN05 (8 nút) Trang phục CNN06 (5 nút) Tồn khn mặt CNN07 (4 nút) Khác CNN08 (6 nút) Bộ liệu CelebA có 202.599 ảnh, ảnh từ 162.771 ảnh dùng để học, ảnh 162.772 182.637 dùng để validate (19.865 ảnh, chiếm 9.81%), ảnh 182.638 202.599 dùng để thử nghiệm (19.962 ảnh, chiếm 9.85%) Do đó, có 162.771 ảnh dùng để học 19.962 ảnh dùng để thử nghiệm Ngôn ngữ sử dụng Matlab, trình biên dịch phiên R2017a 32 Chương 4: Thực nghiệm đánh giá Cấu hình máy dùng để học thử nghiệm: Bảng 4.4 Cấu hình máy học thử nghiệm CPU Intel Core i5-7200U, 2.5 GHz (2 nhân, luồng xử lí) RAM GB DDR4, bus 2400 MHz GPU AMD Radeon R7 M445, GB GDDR5 HDD TB HDD, 5400rpm Các kết thí nghiệm Tác giả thử nghiệm theo nhiều cách khác nhau, sau so sánh độ xác với báo gốc (bài báo [4]) nhằm mục đích chứng minh rằng: Việc gom nhóm thuộc tính theo thành phần khn mặt cho kết tốt việc học lúc 40 thuộc tính Việc học đặc trưng vùng khuôn mặt chọn cho kết tốt việc học đặc trưng tồn khn mặt Việc sử dụng mạng VGG-16 cho kết tốt mạng AlexNet Phương pháp: Đếm số mẫu nhận dạng đúng, tính tỉ lệ tổng số 19.962 ảnh tỉ lệ % Một mẫu coi nhận dạng Expected result = Actual result (kết mong đợi giống kết thực tế) 4.1 Thử nghiệm 1: Trong thử nghiệm 1, tác giả thử nghiệm số thuộc tính riêng biệt nhóm CNN01 – Mắt, nhiên lấy đặc trưng vùng mắt thay lấy đặc trưng tồn khuôn mặt [4]: 33 Chương 4: Thực nghiệm đánh giá Mạng AlexNet: Thuộc tính Số mẫu nhận dạng Tỉ lệ nhận dạng (%) Tỉ lệ theo [4] (%) Arched_Eyebrows 15.783 79.07 79 Bags_Under_Eyes 15.940 79.85 79 Bushy_Eyebrows 17.658 88.46 90 Eyeglasses 19.809 99.23 99 Narrow_Eyes 16.217 81.24 81 85.57 85.6 Trung bình Mạng VGG-16: Thuộc tính Số mẫu nhận dạng Tỉ lệ nhận dạng (%) Tỉ lệ theo [4] (%) Arched_Eyebrows 16.991 85.12 79 Bags_Under_Eyes 16.021 80.26 79 Bushy_Eyebrows 17.768 89.01 90 Eyeglasses 19.724 98.81 99 Narrow_Eyes 17.255 86.44 81 87.93 85.6 Trung bình 34 Chương 4: Thực nghiệm đánh giá 120 100 80 60 40 20 Arched_Eyebrows Bags_Under_Eyes Bushy_Eyebrows Bài báo [4] AlexNet Eyeglasses Narrow_Eyes VGG-16 Hình 4.4 Biểu đồ độ xác thuộc tính AlexNet VGG-16 Nhận xét: AlexNet cho kết không khác so với báo gốc, độ xác gần giữ nguyên, VGG-16 cho độ xác cao đáng kể, nhiên VGG-16 có số thuộc tính cho kết thấp Kết luận: Việc lấy đặc trưng theo vùng khuôn mặt cho kết khả quan việc lấy đặc trưng toàn khn mặt Ví dụ với thuộc tính mắt có vùng mắt ảnh hưởng rõ rệt, nên việc lấy đặc trưng tồn khn mặt gây nhiễu ảnh hưởng đến độ xác thuộc tính Tương tự thuộc tính liên quan đến mũi, miệng… 4.2 Thử nghiệm 2: Trong thử nghiệm 2, tác giả thực với thuộc tính thuộc nhóm CNN-06 – Trang phục, lấy đặc trưng toàn ảnh 35 Chương 4: Thực nghiệm đánh giá Mạng AlexNet: Thuộc tính Số mẫu nhận dạng Tỉ lệ nhận dạng (%) Tỉ lệ theo [4] (%) Wearing Earrings 15.982 80.06 82 Wearing Hat 19.726 98.82 99 Wearing Lipstick 18.593 93.14 93 Wearing Necklace 14.444 72.36 71 Wearing Necktie 18.590 93.13 93 87.5 87.6 Trung bình Mạng VGG-16: Thuộc tính Số mẫu nhận dạng Tỉ lệ nhận dạng (%) Tỉ lệ theo [4] (%) Wearing Earrings 16.353 81.92 82 Wearing Hat 19.764 99.01 99 Wearing Lipstick 19.469 97.53 93 Wearing Necklace 15.758 78.94 71 Wearing Necktie 19.171 96.04 93 90.69 87.6 Trung bình 36 Chương 4: Thực nghiệm đánh giá 120 100 80 60 40 20 Wearing Earrings Wearing Hat Wearing Lipstick Bài báo [4] AlexNet Wearing Necklace Wearing Necktie VGG-16 Hình 4.5 Biểu đồ độ xác thuộc tính AlexNet VGG-16 Nhận xét: Tương tự thử nghiệm 1, AlexNet cho kết không khác nhiều so với báo gốc, độ xác gần giữ nguyên, VGG-16 cho độ xác cao đáng kể, nhiên VGG-16 có số thuộc tính cho kết thấp Kết luận: Do thử nghiệm lấy đặc trưng tồn khn mặt giống với báo [4] nên kết luận sử dụng mạng VGG-16 cho kết tốt AlexNet tốt mạng LNet+ANet [4] số thuộc tính 37 Chương 5: Kết luận hướng phát triển Kết luận Bài toán phát mặt người (face dectection & recognition) đạt thành công tương đối rõ ràng Tuy nhiên nhiều thách thức mảng “chiến trường cạnh tranh khốc liệt” Luận văn không vào nhận dạng khuôn mặt (khái niệm) mà thay vào nhận dạng thuộc tính (dấu khái niệm) Luận văn công dựa tảng chính: Phân nhóm thuộc tính để hỗ trợ cho giai đoạn học thuộc tính: Thay phải học 40 thuộc tính chia nhỏ thành nhiều nhóm nhằm tăng tính linh hoạt hệ thống, tận dụng khả học đa nhiệm (multitask learning) Chọn kiến trúc mạng tầm trung VGG-16, không phức tạp, đồ sộ không đơn giản, vừa đủ để giải toán đặt phần phát biểu toán Chương 1, phần Kết đạt được: hiệu suất, độ xác luận văn tương đối tốt, so sánh với phương pháp state-of-the-art Hướng phát triển Tìm cách cải thiện hiệu suất hệ thống, tìm kiếm mơ hình mạng giúp phát nhận dạng tốt hơn, đạt hiệu suất cao thời gian chạy ngắn Tìm cách áp dụng vào tốn truy vấn ảnh, tìm kiếm tội phạm, lọc liệu nhanh… 38 Tài liệu tham khảo [1] Rostislav Goroshin (2015), "Unsupervised Feature Learning in Computer Vision" [2] Pierre Sermanet (2014), "A Deep Learning Pipeline for Image Understanding and Acoustic Modeling", New York University, ProQuest Dissertations Publishing [3] Matthew D Zeiler (2014), "Hierarchical Convolutional Deep Learning" [4] Ziwei Liu, Ping Luo, Xiaogang Wang, Xiaoou Tang (2015), "Deep Learning Face Attributes in the Wild", International Conference on Computer Vision (ICCV) 2015 [5] Neeraj Kumar (2011), "Describable Visual Attributes for Face Images" [6] Yang Zhong, Josephine Sullivan, Haibo Li (2016), "Face Attribute Prediction using Off-the-Shelf CNN Features" [7] Syazana-Itqan K, Syafeeza A.R and Saad N.M (2016), "A Matlab-based Convolutional Neural Network Approach For Face Recognition System" [8] Karen Simonyan, Andrew Zisserman (2015), “Very Deep Convolutional Networks for Large-Scale Image Recognition” [9] Dayong Wang, Steven C.H Hoi, Ying He, Jianke Zhu (2013), "Retrieval-Based Face Annotation by Weak Label Regularized Local Coordinate Coding" [10] Rasoul Banaeeyan, Mohd Haris Lye, Mohammad Faizal Ahmad Fauzi, H Abdul Karim and John See (2016), "Deep or Shallow Facial Descriptors? A Case for Facial Attribute Classification and Face Retrieval", in the proceeding of ACCV Workshop [11] A S Razavian, H Azizpour, J Sullivan, and S Carlsson (2014), "CNN features off-the-shelf: an astounding baseline for recognition" [12] Yi Sun, Xiaogang Wang, Xiaoou Tang (2014), “Deep Learning Face Representation from Predicting 10,000 Classes” 39 Chương 4: Thực nghiệm đánh giá [13] Thomas Berg, Peter N Belhumeur (2013), “POOF Part-Based One-vs-One Features for Fine-Grained Categorization, Face Verification, and Attribute Estimation” [14] Max Ehrlich, Timothy J Shields, Timur Almaev, Mohamed R Amer (2016), “Facial Attributes Classification Using Multi-Task Representation Learning” [15] Haoqiang Fan, Erjin Zhou (2016), “Approaching human level facial landmark localization by deep learning” [16] Zhanpeng Zhang, Ping Luo, Chen Change Loy, Xiaoou Tang (2014), “Facial Landmark Detection by Deep Multi-task Learning” [17] Ping Luo, Xiaogang Wang, Xiaoou Tang (2013), “A deep sum-product architecture for robust facial attributes analysis” [18] Fengyi Song, Xiaoyang Tan, Songcan Chen (2014), “Exploiting relationship between attributes for improved face verification” [19] Ethan M Rudd, Manuel Gunther, Terrance E Boult (2016), “MOON A Mixed Objective Optimization Network for the Recognition of Facial Attributes” [20] Ning Zhang, Manohar Paluri, Marc’Aurelio Ranzato, Trevor Darrell, Lubomir Bourdev (2014), “Panda Pose aligned networks for deep attribute modeling” [21] Hongxin Liu, Xiaorong Shen, Haibing Ren (2016), “FDAR-Net Joint Convolutional Neural Networks for Face Detection and Attribute Recognition” [22] Sunghun Kang, Donghoon Lee, Chang D Yoo (2015), “Face attribute classification using attribute-aware correlation map and gated convolutional neural networks” [23] Yang Zhong, Josephine Sullivan, Haibo Li (2016), “Face Attribute Prediction with classification CNN” [24] Shiyao Wang, Zhidong Deng, and Zhenyang Wang (2016), “Collaborative Learning Network for Face Attribute Prediction” 40 Chương 4: Thực nghiệm đánh giá [25] Alex Krizhevsky, Ilya Sutskever, Geoffrey E Hinton (2012), “ImageNet Classification with Deep Convolutional Neural Networks” 41 ... thống nhận dạng mặt người dựa thuộc tính Với hệ thống nhận dạng mặt người dựa thuộc tính, framework hệ thống có dạng sau: Input Nhận dạng thành phần khn mặt Nhận dạng thuộc tính khn mặt Output Hình... hình học thuộc tính mặt người dựa mạng học sâu Hình 3.2 Ví dụ kết sau nhận dạng thành phần khuôn mặt Sau nhận dạng thành phần khuôn mặt, hệ thống tiếp tục với module thứ hai: Nhận dạng thuộc tính. .. hình học thuộc tính mặt người dựa mạng học sâu Việc phân loại thuộc tính theo nhóm định số mạng CNN hệ thống: Có nhóm nên có mạng khác nhau, số đầu mạng số thuộc tính có mạng Sau cần mở rộng hệ thống,