Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 75 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
75
Dung lượng
3,28 MB
Nội dung
HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG - Đặng Đình Nghĩa NGHIÊN CỨU VÀ ỨNG DỤNG MẠNG NƠRON TÍCH CHẬP TRONG NHẬN DẠNG KHN MẶT CĨ KHẨU TRANG LUẬN VĂN THẠC SỸ KỸ THUẬT (Theo định hướng ứng dụng) HÀ NỘI – NĂM 2022 HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THÔNG - Đặng Đình Nghĩa NGHIÊN CỨU VÀ ỨNG DỤNG MẠNG NƠRON TÍCH CHẬP TRONG NHẬN DẠNG KHN MẶT CĨ KHẨU TRANG Chuyên ngành : Khoa học máy tính Mã số: 8.48.01.01 LUẬN VĂN THẠC SỸ KỸ THUẬT (Theo định hướng ứng dụng) NGƯỜI HƯỚNG DẪN KHOA HỌC: TS NGUYỄN ĐÌNH HĨA HÀ NỘI – NĂM 2022 LỜI CAM ĐOAN Luận văn thành trình học tập nghiên cứu em giúp đỡ, khuyến khích q thầy sau hai năm theo học chương trình đào tạo Thạc sỹ, chuyên ngành Khoa học máy tính trường Học viện Cơng nghệ Bưu Viễn thơng Em xin cam đoan cơng trình nghiên cứu riêng Nội dung luận văn có tham khảo sử dụng số thơng tin, tài liệu từ nguồn sách, tạp chí liệt kê danh mục tài liệu tham khảo trích dẫn hợp pháp Tác giả (Ký ghi rõ họ tên) Đặng Đình Nghĩa LỜI CẢM ƠN Sau thời gian dài học tập nghiên cứu, cuối em hoàn thành luận văn tốt nghiệp này, dịp tốt để em bày tỏ lòng biết ơn sâu sắc đến người Em xin gửi lời cảm ơn sâu sắc đến thầy Nguyễn Đình Hóa, tận hình hướng dẫn, định hướng cho em suốt thời gian thực đề tài Thầy cho em lời khuyên quý báu giúp em hoàn thành tốt luận văn Em xin cảm ơn Khoa Sau Đại học, Khoa Công Nghệ Thông Tin – Học viện Cơng nghệ Bưu Viễn thơng, cảm ơn thầy khoa tận tình giảng dạy, truyền đạt cho em kiến thức quý báu năm học vừa qua, giúp cho em có tảng kiến thức vững để thực luận văn nghiên cứu học tập sau Cuối cùng, xin gửi lời cảm ơn đến tất bạn bè, anh, chị, người giúp đỡ, khích lệ phê bình, góp ý, giúp tơi hồn thành khóa luận cách tốt Hà Nội, tháng 01 năm 2022 Đặng Đình Nghĩa i MỤC LỤC MỤC LỤC i DANH MỤC KÝ HIỆU, CHỮ VIẾT TẮT iii DANH MỤC BẢNG BIỂU iv DANH MỤC HÌNH VẼ, SƠ ĐỒ v MỞ ĐẦU Chương TỔNG QUAN VỀ NHẬN DẠNG KHUÔN MẶT 1.1 Tổng quan toán nhận dạng khuôn mặt 1.1.1 Tổng quan .4 1.1.2 Các nghiên cứu có liên quan 1.2 Tổng quan mạng Nơ-ron nhân tạo, mạng Nơ-ron tích chập 11 1.2.1 Tổng quan mạng Nơ-ron nhân tạo 11 1.2.2 Tổng quan mạng Nơ-ron tích chập 16 1.3 Đề xuất phương pháp nhận diện khn mặt có đeo trang 22 1.4 Kết chương 23 Chương NHẬN DẠNG KHUÔN MẶT SỬ DỤNG MẠNG NƠ-RON TÍCH CHẬP 24 2.1 Kiến trúc mạng Nơ-ron tích chập giải pháp nhận dạng khn mặt có đeo trang 24 2.2 Ưu điểm mạng Nơ-ron tích chập so với phương pháp khác 29 2.3 Hệ thống nhận dạng khn mặt có đeo trang 32 ii 2.3.1 Xác định khuôn mặt đeo trang 32 2.3.2 Xác định vị trí khn mặt ảnh 33 2.3.3 Căn chỉnh lại khuôn mặt .37 2.3.4 Trích chọn đặc trưng phục vụ cho trình nhận dạng .39 2.3.5 Nhận dạng khuôn mặt 43 2.4 Kết chương 44 Chương CÁC KẾT QUẢ THỰC NGHIỆM 45 3.1 Tập liệu sử dụng kịch kiểm thử hệ thống 45 3.1.1 Thu thập liệu 45 3.1.2 Xử lý liệu .46 3.1.3 Bộ liệu đánh giá .50 3.2 Kết thực nghiệm đánh giá 55 3.3 Kết chương 58 KẾT LUẬN 59 TÀI LIỆU THAM KHẢO 61 iii DANH MỤC KÝ HIỆU, CHỮ VIẾT TẮT Từ viết tắt Tiếng Việt Tiếng Anh AI Trí tuệ nhân tạo Artificial Intelligence CNN Mạng Nơ-ron tích chập ANN Mạng Nơ-ron nhân tạo Artificial Neural Network HOG Đặc trung HOG Histogram of gradient SVM Máy hỗ trợ vector Support vector machine MLP Mạng Nơ-ron nhiều lớp Multi layer perceptron LBP Đặc trưng LBP Local binary patterns SIFT Đặc trưng SIFT SURF Đặc trưng SURF Speeded up robust features 10 DCNN Mạng Nơ-ron tích chập Deep Convolutional Neural sâu Network STT Convolutional neural network Scale-invariant feature transform iv DANH MỤC BẢNG BIỂU Bảng 1-1: Kết đánh giá liệu LFW phương pháp trích xuất đặc trưng cứng Bảng 1-2: So sánh ArcFace với phương pháp khác tập LFW YTF .10 Bảng 3-1: Các liệu khuôn mặt 46 Bảng 3-2: Kết đánh giá liệu COMASK20 54 Bảng 3-3: Kết triển khai thực tế 56 v DANH MỤC HÌNH VẼ, SƠ ĐỒ Hình 1-1: Các bước hệ thống nhận diện khn mặt .7 Hình 1-2: Mơ hình tổng qt FaceNet .9 Hình 1-3: Triplet loss sử dụng FaceNet Hình 1-4: Biểu diễn perceptron dạng neural network 11 Hình 1-5: Biểu diễn Linear Regression dạng neural network .12 Hình 1-6: Mô tả Nơ-ron thần kinh sinh học 13 Hình 1-7: Hàm kích hoạt sigmoid ReLU 14 Hình 1-8: Hoạt động lọc .18 Hình 1-9: Hoạt động Max Pooling layer 19 Hình 1-10: Kiến trúc mạng CNN cho tốn phân loại ảnh 19 Hình 1-11: Kiến trúc mạng LeNet-5 cho nhận diện chữ số viết tay 20 Hình 1-12: Kiến trúc mạng AlexNet 20 Hình 1-13: Kiến trúc mạng ZFNet 21 Hình 1-14: Biểu đồ so sánh kiến trúc mạng CNN 21 Hình 2-1: Khối mạng tích chập thơng thường (bên trái) khối mạng phần dư (bên phải) 26 Hình 2-2: Khối ResNet thông thường (bên trái); Khối ResNet với tầng tích chập 1x1 (bên phải) 26 Hình 2-3: Batch/Power Normalization 27 Hình 2-4: Khối mạng Conv1 28 Hình 2-5: Kiến trúc Resnet-152 .29 vi Hình 2-6: Các mơ hình trích chọn đặc trưng qua giai đoạn phát triển 29 Hình 2-7: Các kiến trúc mạng CNN cho nhận diện khuôn mặt qua năm 30 Hình 2-8: Các loss functions gần phục vụ cho nhận diện khn mặt .30 Hình 2-9: Các convolution layer khác với kiến trúc mạng CNN khác 31 Hình 2-10: Pipeline hệ thống nhận diện khn mặt có đeo trang 32 Hình 2-11: Đặc trưng HOG ảnh chứa khn mặt 34 Hình 2-12: Các đặc trưng Haar 34 Hình 2-13: Các đặc trưng Haar khn mặt vị trí khác 35 Hình 2-14: Sơ đồ khối hệ thống detect khn mặt thuật toán Viola-Jones 36 Hình 2-15: Ảnh trước sau chạy thuật tốn NMS 36 Hình 2-16: Kiến trúc mạng SSD YOLO 37 Hình 2-17: Vị trí 68 điểm landmark có khn mặt 38 Hình 2-18: Q trình alignment lại khn mặt 39 Hình 2-19: Mơ hình q trình huấn luyện kiểm thử mạng CNN cho tốn nhận diện khn mặt 39 Hình 2-20: Quá trình xử lý thuật tốn Arcface 43 Hình 3-1: Sự phát triển tập liệu khn mặt qua năm 45 Hình 3-2: Hình ảnh thực tế liệu CASIA-Webface 46 Hình 3-3: Quá trình tạo Position map 48 Hình 3-4: Q trình tạo cấu trúc 3D khn mặt 48 50 Hình 3-6: Quá trình xử lý thuật toán sinh trang Một số kết sau thuật tốn sinh trang: Hình 3-7: Kết thu sau sinh trang 3.1.3 Bộ liệu đánh giá Tùy vào ứng dụng thực tế mà việc nhận diện khuôn mặt phân loại thành toán face verification hay face identification Face verification: toán xác thực liệu ảnh có phải người khơng, ứng dụng nhiều toán bảo mật thơng tin Một khn mặt đăng kí với hệ thống từ sau để mở khóa hệ thống đưa khn mặt vào thơng qua mơ hình trích chọn đặc trưng vector, vector đem so sánh với vector trích chọn đặc trưng từ khn mặt đăng 51 kí, khoảng cách vector đủ nhỏ ngưỡng so sánh hệ thống bảo mật mở khóa Hình 3-8: Face verification Face identification: khác với toán face verification, toán mục tiêu xác định danh tính khn mặt so với tập khuôn mặt Ở lại chia làm toán Open-set face identification Close-set face identification o Với Close-set khn mặt nhận diện phân vào khn mặt nằm tập thư viện o Cịn với Open-set tốn trở nên phức tạp chỗ phải xác định xem khn mặt có nằm tập thư viện không xác định danh tính khn mặt 52 Hình 3-9: Face identification Đối với tốn nhận diện khn mặt nói chung, việc đánh giá mơ hình thường thực liệu ứng với nhóm chủng tộc khác nhau, ví dụ như: African, Caucasian, South Asian (Nam Á), East Asian (Đông Á), …, hay dựa đặc điểm liệu như: Easy (dễ), Medium (trung bình), Hard (khó); ….Trong luận văn này, để đánh giá mơ hình, cụ thể với người Việt Nam, tác giả sử dụng liệu COMASK20 [35] – liệu thu thập bao gồm ảnh chân dung sinh viên Học viện Công nghệ Bưu Viễn thơng Cấu trúc file liệu bao gồm folder, folder đại diện cho người chứa ảnh chân dung khác người (cụ thể Hình 3-5) Mỗi folder ứng với danh tính bao gồm: ảnh khn mặt đeo trang ảnh khuôn mặt không đeo trang Hình 3-10: Cấu trúc file liệu COMASK20 53 Dữ liệu COMASK20 ban đầu thu chứa folder (ứng với danh tính) có tên file sử dụng ký tự tiếng Việt Do đó, bước xử lý đầu tiên, để thuận tiện việc lập trình, ta chuyển đổi tên file sang dạng chữ tiếng anh thông thường, không ký tự đặc biệt Sau đó, ta tách riêng liệu bao gồm ảnh đeo trang từ liệu ban đầu Và từ liệu tách, ta chia thành hai tập database test Các folder tập database gồm ảnh, đóng vai trò ảnh đăng ký người dùng toán nhận diện Các folder tập test bao gồm ảnh để so sánh với ảnh database để dự đốn danh tính Cuối cùng, ta cho ảnh qua bước tiền xử lý toán nhận diện, bao gồm nhận diện chỉnh Dữ liệu ảnh thu có kích thước 112x112 đưa trực tiếp qua mơ hình để thu đặc trưng ảnh Ta sử dụng kiến trúc ResNet50 ResNet100, pretrained liệu Glint360k để thực đánh giá liệu đeo trang COMASK20 Công thức đánh sau [36]: độ 𝑐ℎí𝑛ℎ 𝑥á𝑐 = 𝑠ố 𝑐á𝑐 ả𝑛ℎ 𝑑ự 𝑏á𝑜 đú𝑛𝑔 𝑡ổ𝑛𝑔 𝑠ố ả𝑛ℎ 𝑡𝑟𝑜𝑛𝑔 𝑡ậ𝑝 𝑑ữ 𝑙𝑖ệ𝑢 Ta thực thiện so sánh độ xác theo trường hợp khác nhau: Để tối ưu đạt độ xác tốt, khảo sát khoảng cách cặp feature vector cặp ảnh tương ứng qua mạng, với dải ngưỡng từ 0.5 đến 0.7 (t = 0.5, t = 0.6, t = 0.7) không đặt ngưỡng với cơng thức sau [36]: độ 𝑐ℎí𝑛ℎ 𝑥á𝑐 (𝑡 = 𝑛) = Kiến trúc Không đặt mạng ngưỡng ResNet 100 78.45% 𝑠ố 𝑐á𝑐 ả𝑛ℎ 𝑑ự 𝑏á𝑜 đú𝑛𝑔 (𝑣ớ𝑖 𝑠𝑐𝑜𝑟𝑒 ≥ 𝑛) 𝑡ổ𝑛𝑔 𝑠ố ả𝑛ℎ 𝑡𝑟𝑜𝑛𝑔 𝑡ậ𝑝 𝑑ữ 𝑙𝑖ệ𝑢 (𝑣ớ𝑖 𝑠𝑐𝑜𝑟𝑒 ≥ 𝑛) Ngưỡng t=0.5 Ngưỡng t = 0.6 Ngưỡng t =0.7 83.20% 87.89% 91.92% 54 ResNet 152 - 81.57% 86.33% 91.82% 95.97% irse Bảng 3-2: Kết đánh giá liệu COMASK20 Ngoài ra, Để đánh giá mơ tồn hệ thống tác giả thu thập liệu thực tế văn phịng thuộc Trung tâm Cơng nghệ thơng tin MobiFone Tập liệu gồm 50 người, người có ảnh đăng ký không đeo trang ảnh đeo trang dùng để test việc nhận diện Việc đánh giá liệu thực tế giúp cho việc đánh giá đạt độ tin tưởng cao hơn, thực tế có nhiều trường hợp khơng thể tính tốn trước Hình 3-11: Hình ảnh thu thập thực tế Để test mơ hình, ngồi việc test ảnh đơn tác giả cịn tích hợp core nhận diện vào việc check in văn phịng thơng qua thiết bị tabnet 55 Hình 3-12: Thiết bị dùng để test 3.2 Kết thực nghiệm đánh giá Dưới vài hình ảnh thực tế hệ thống triển khai văn phịng thuộc Trung tâm Cơng nghệ thơng tin MobiFone Hình 3-13: Kết nhận diện thực tế Trong thực tế, người dùng khơng hồn tồn hướng diện khuôn mặt vào camera, vài trường hợp không nhận diện 56 Hình 3-14: Các trường hợp nhận diện thực tế Tương tự cách đánh giá liệu COMASK 20 sau huấn luyện xong mơ hình, tác giả dùng phương pháp đánh giá tương tự triển khai đánh giá liệu thực tế (50 cặp ảnh thu thập thực tế) Dùng ngưỡng khác (t = 0.5, t = 0.6, t = 0.7) để đánh giá, cặp ảnh người phải có khoảng cách bé giá trị threshold ngược lại, ta thu kết sau: STT Ngưỡng Độ xác t = 0.5 88.00% t = 0.6 92.00% t = 0.7 94.00% Bảng 3-3: Kết triển khai thực tế Dựa kết thử nghiệm, thấy với ngưỡng phù hợp mơ hình mạng hoạt động tốt với ảnh RGB đạt độ xác trung bình tới khoảng 91.3% 57 3.3 Các đóng góp phạm vi áp dụng: Luận văn áp dụng nghiên cứu khoa học vào giải tốn thực tế sống tốn nhận diện khn mặt có trang Như trình bày trước đó, tốn ứng dụng trí tuệ nhận tạo vấn đề liệu vô quan trọng Với việc áp dụng thành công thuật tốn sinh trang cho khn mặt giảm thiểu nhiều thời gian cho trình làm liệu toán Bên cạnh khâu chuẩn bị liệu, việc khảo sát lựa chọn thuật toán học sâu để phù hợp với toán nhận diện khn mặt thách thức Các thuật tốn phải thử nghiệm thực tế tính tốn thời gian dự đoán Cần phải cân độ xác tốc độ để áp dụng vào thực tế Bài tốn nhận diện khn mặt có trang kiểm thử thực tế văn phòng thuộc Trung tâm CNTT MobiFone Đối với tốn nhận diện khn mặt có trang chất lượng ảnh đầu vào định nhiều đến độ xác Khơng giống tốn nhận diện khn mặt thơng thường, hình ảnh có độ phân giải tốn nhận diện có trang u cầu cần có độ sắc nét Hình ảnh dự đốn nên hình ảnh thu qua điện thoại tabnet để giảm bớt tác động yếu tố bên ngồi làm giảm chất lượng hình ảnh dẫn đến giảm chất lượng dự đoán Bài toán nhận diện khn mặt có trang thực cần thiết bái cảnh dịch bệnh covid Hiện toán áp dụng vào việc chấm cơng hàng ngày văn phịng dễ dàng tích hợp vào ứng dụng cần nhận diện khuôn mặt sống, ứng dụng đây: Mở khóa khn mặt thiết bị thông minh: Đây muột bước ngoặt ngành công nghệ, nhận diện khuôn mặt đời cụ thể ngành điện thoại phát triển thêm loại khóa bảo mật khn mặt Cơng nghệ thấy dịng điện thoại smart phone áp dụng làm hiệu Chúng giúp bảo mật thông tin liệu cá nhân cách tốt nhất, an tồn nhất, trí chúng bảo đảm bạn bị điện thoại tội phạm khơng thể truy cập tiếp cận lấy liệu bạn 58 Nhận diện khuôn mặt giúp ngăn chặn tội phạm cửa hàng: Với nhứng hệ thống camera sắc nét hồn tồn sử dụng để xác định danh tính tội phạm chúng cịn giúp chủ cửa hàng biết tiền sử gian lận trước thông báo để kịp thời ngăn chặn Những thông tin bao gồm hình ảnh cá nhân tội phạm với liệu gửi đến thông báo đến chủ cửa hàng Nhận dạng người mạng xã hội: Có lẽ tính mà điều thấy trải nghiệm rõ nhất, thực tế gần gũi khơng xa lạ tính khác Bởi giới nước tự mạng xã hội cơng cụ ứng dụng phổ biến rộng rãi điển ơng lớn FaceBook Điều thấy rõ bạn đăng hình bao gồm nhiều thành viên lên mạng xã hội cơng nghệ nhận diện khn mặt tự động đề xuất gắn thẻ thành viên có mặt hình sử dụng mạng xã hội 3.4 Kết chương Chương trình bày tập liệu mà luận văn sử dụng, liệu đa dạng phần lớn liệu khn mặt đeo trang Các bước tạo xử lý liệu làm rõ Phần với kiến trúc mạng CNN dùng cho trích chọn đặc trưng, việc fine tuning lại mạng với liệu đạt độ xác cao ~94% tập ảnh triển khai thực tế để đánh giá mơ hình Về kết sử dụng mạng ResNet dùng để trích chọn đặc trưng khuôn mặt phục vụ cho nhận diện với tập liệu ảnh làm rõ Những hình ảnh nhận diện khuôn mặt thực tế triển khai trình bày chương 59 KẾT LUẬN Trên sở tìm hiểu tốn nhận dạng khn mặt có đeo trang sử dụng mạng Nơ-ron tích chập, luận văn đạt số kết sau: - Giới thiệu tổng quan lịch sử hình thành, kiến thức mạng Nơ-ron nhân tạo mạng Nơ-ron tích chập Về mạng Nơ-ron, luận văn làm rõ cấu trúc Nơ-ron nhân tạo, cách hoạt động thành phần Nơ-ron Ngoài ra, luận văn trình bày mạng Nơ-ron tích chập, thành phần số kiến trúc mạng tiêu biểu Để dựa vào mà đưa hướng tiếp cận với toán nhận dạng khn mặt có trang - Tìm hiểu số nghiên cứu liên quan nhận dạng khuôn mặt cách sử dụng phương pháp xử lý ảnh thông thường sử dụng thuật toán học sâu: toán nhận dạng khn mặt nói chung dựa việc trích chọn đặc trưng khn mặt - Trình bày phương pháp áp dụng mạng Nơ-ron tích chập cho tốn nhận dạng khn mặt có trang - Tiến hành thu thập xử lý liệu, chuẩn hóa liệu chuẩn bị cho training thử nghiệm đo tỉ lệ xác - Xây dựng hệ thống nhận dạng khn mặt Bên cạnh kết đạt hạn chế cần phải khác phục: - Việc nhận diện chủ thể chưa thực ổn định ảnh khn mặt khơng diện - Số liệu chưa đủ nhiều đa dạng, nguyên nhân dẫn đến tỉ lệ xác chưa cao - Xử lý liệu chưa đáp ứng theo thời gian thực nên việc nhận diện bị chậm 60 Kết chưa thực hoàn hảo đạt đến số chất lượng tốt định để đáp ứng yêu cầu đề độ xác yếu tố cân khác, phục vụ hướng tìm hiểu, triển khai nghiên cứu cơng nghệ nhận diện khn mặt Để phát triển tiếp tốn vấn đề liệu cần cải thiện nhiều nữa, bên cạnh thuật tốn liên quan đến nhận diện khn mặt cịn sử dụng ảnh 3D Việc sử dụng ảnh 3D giúp thu đặc trưng khuôn mặt hiệu so với ảnh 2D Việc sử dụng ảnh 3D để nhận dạng khn mặt có đeo trang hứa hẹn đạt kết tốt 61 TÀI LIỆU THAM KHẢO [1] D Chen, X Cao, F Wen, and J Sun, “Blessing of dimensionality: Highdimensional feature and its efficient compression for face verification,” Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition, pp 3025–3032, 2013, doi: 10.1109/CVPR.2013.389 [2] X T Z Cao, Q Yin, and J Sun, “Face recognition with learning-based descriptor,” Computer Vision and Pattern Recognition, pp 2707–2714, 2010 [3] A H T Ahonen, and M Pietikainen, “Face Description with Local Binary Patterns: Application to Face Recognition,” IEEE Trans on PAMI, pp 2037– 2041, 2006 [4] D G Lowe, “Distinctive Image Features from Scale-Invariant Keypoints,” Int J Comput Vision [5] C Shu, X Ding, and C Fang, “Histogram of the oriented gradient for face recognition,” Tsinghua Science and Technology, vol 16, no 2, pp 216–224, 2011, doi: 10.1016/S1007-0214(11)70032-3 [6] C L and H Wechsler, “Gabor feature based classification using the enhanced fisher linear discriminant model for face recognition,” TIP, pp 467–476, 2002 [7] T H H Zou, and R Tibshirani, “Sparse Principal Component Analysis,” Journal of Computational and Graphical Statistics, vol 15, pp 265–286, 2006 [8] T B G B Huang, M Mattar, and E Learned-Miller, “Labeled faces in the wild: A database for studying face recognition in unconstrained environments,” 2007 [9] F Schroff, D Kalenichenko, and J Philbin, “FaceNet: A unified embedding for face recognition and clustering,” Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition, vol 07-12June, pp 815–823, 2015, doi: 10.1109/CVPR.2015.7298682 62 [10] T H L Wolf, and I Maoz, “Face recognition in unconstrained videos with matched background similarity,” IEEE Conf on CVPR, 2011 [11] J Deng and S Zafeiriou, “ArcFace: Additive Angular Margin Loss for Deep Face Recognition” [12] K He, “Deep Residual Learning for Image Recognition” [13] G E H and R J W Rumelhart, David E., “Learning representations by backpropagating errors,” Nature 323, pp 533–536 [14] “IMAGENET.” https://image-net.org/ (accessed Dec 03, 2021) [15] “ImageNet Large Scale Visual Recognition Challenge.” http://www.imagenet.org/challenges/LSVRC (accessed Oct 15, 2021) [16] M A Hearst, “Support Vector Machines,” IEEE Intelligent Systems [17] I S Alex Krizhevsky, and Geoffrey E Hinton, “ImageNet classification with deep convolutional neural networks,” In Proceedings of the 25th International Conference on Neural Information Processing Systems, vol 2, 2012 [18] M D Zeiler and R Fergus, “Visualizing and Understanding Convolutional Networks,” 2012 [19] J Z and W L Wang, Hao, Yitong Wang, Zheng Zhou, Xing Ji, Zhifeng Li, Dihong Gong, “CosFace: Large Margin Cosine Loss for Deep Face Recognition,” CVPR, 2018 [20] A G Howard et al., “MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications,” 2017 [21] P V and M J Jones, “Robust Real-Time Face Detection,” Int J Comput Vision 57, vol 2, pp 137–154 [22] P A and M J J Viola, “Rapid Object Detection using a Boosted Cascade of Simple Features,” CVPR, 2001 63 [23] J and J M Sochman, “AdaBoost with totally corrective updates for fast face detection,” Sixth IEEE International Conference on Automatic Face and Gesture Recognition, pp 445–450, 204AD [24] E H A and C H A and J R B and P J B and J M Ogden, “Pyramid methods in image processing,” 1984 [25] Z L and Y Q Zhang, Kaipeng, Zhanpeng Zhang, “Joint Face Detection and Alignment Using Multitask Cascaded Convolutional Networks,” IEEE Signal Processing Letters 23, pp 1499–1503, 2016 [26] Y and Q J Wu, “Facial Landmark Detection: A Literature Survey,” International Journal of Computer Vision, pp 1–28, 2018 [27] V and J S Kazemi, “One millisecond face alignment with an ensemble of regression trees,” 2014 IEEE Conference on Computer Vision and Pattern Recognition, pp 1867–1874, 2014 [28] “iBUG 300-W Dataset.” https://ibug.doc.ic.ac.uk/resources/300-W (accessed Oct 15, 2021) [29] and J S D Chen, X Cao, L Wang, F Wen, “Bayesian face revisited: A joint formulation,” Computer Vision– ECCV, pp 566–579, 2012 [30] and X T Y Sun, X Wang, “Deep learning face representation by joint identification-verification,” arXiv preprint arXiv, 2014 [31] M R Y Taigman, M Yang, and L Wolf, “Deepface: Closing the gap to human-level performance in face verification,” Computer Vision and Pattern Recognition (CVPR), 2014 [32] C.-S C B.-C Chen, and W H Hsu, “Cross-age reference coding for ageinvariant face recognition and retrieval,” Computer Vision–ECCV, pp 768– 783, 2014 64 [33] D Yi, Z Lei, S Liao, and S Z Li, “Learning Face Representation from Scratch” [34] Y Feng et al., “Joint 3D Face Reconstruction and Dense” [35] H Nam, V Mai, H Nguyen, and C Pham, “Masked face recognition with convolutional neural networks and local binary patterns,” 2021 [36] Mei Wang, Weihong Deng, “Deep Face Recognition: A Survey,” Computer Vision and Pattern Recognition (CVPR), 2018 ... khn mặt có đeo trang dựa mạng Nơron tích chập 3 - Chương 2: Nhận dạng khn mặt sử dụng mạng Nơ-ron tích chập Chương trình bày cấu trúc mạng Nơ-ron tích chập giải pháp nhận dạng khn mặt có đeo trang. .. nhận dạng khuôn mặt số phương pháp nhận dạng khuôn mặt công bố nghiên cứu gần Tổng quan mạng Nơ-ron, mạng Nơ-ron tích chập ứng dụng chúng tốn nhận dạng khn mặt Đề xuất phương pháp giải tốn nhận dạng. .. dạng khn mặt có đeo trang sử dụng mạng Nơron tích chập 2.1 Kiến trúc mạng Nơ-ron tích chập giải pháp nhận dạng khn mặt có đeo trang Trong trình phát triển kiến trúc mạng Nơ-ron tích chập đại