(Luận văn thạc sĩ) hệ thống nhận diện khuôn mặt qua camera

72 28 0
(Luận văn thạc sĩ) hệ thống nhận diện khuôn mặt qua camera

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG - NGUYỄN QUANG HUY HỆ THỐNG NHẬN DIỆN KHUÔN MẶT QUA CAMERA LUẬN VĂN THẠC SĨ KỸ THUẬT (Theo định hướng ứng dụng) HÀ NỘI - 2020 HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THÔNG - NGUYỄN QUANG HUY HỆ THỐNG NHẬN DIỆN KHUÔN MẶT QUA CAMERA CHUYÊN NGÀNH: KHOA HỌC MÁY TÍNH MÃ SỐ: 8.48.01.01 LUẬN VĂN THẠC SĨ KỸ THUẬT (Theo định hướng ứng dụng) NGƯỜI HƯỚNG DẪN KHOA HỌC: TS NGUYỄN ĐÌNH HĨA HÀ NỘI - 2020 i LỜI CAM ĐOAN Tơi xin cam đoan luận văn cơng trình nghiên cứu cá nhân tôi, thực sở nghiên cứu lý thuyết, thực tế hướng dẫn TS Nguyễn Đình Hóa Các số liệu, kết nêu luận văn trung thực chưa công bố công trình khác Hà Nội, ngày 16 tháng 11 năm 2020 Học Viên Thực Hiện Nguyễn Quang Huy ii LỜI CẢM ƠN Em xin chân thành cảm ơn TS Nguyễn Đình Hóa tận tình dạy hướng dẫn cho em việc lựa chọn đề tài, thực đề tài viết báo cáo luận văn, giúp em hoàn thành tốt luận văn Em xin cám ơn thầy cô giáo trường Học viện Công nghệ Bưu Viễn thơng tận tình dạy dỗ bảo em suốt năm học Cuối em xin cám ơn gia đình, bạn bè, đồng nghiệp, người bên cạnh động viên em lúc khó khăn giúp đỡ em suốt thời gian học tập làm luận văn, tạo điều kiện tốt cho em để hồn thành tốt luận văn Mặc dù cố gắng hồn thành nghiên cứu phạm vi khả cho phép chắn không tránh khỏi thiếu sót Em kính mong nhận góp ý, thơng cảm thầy cô bạn Em xin chân thành cảm ơn! Hà Nội, ngày 12 tháng 11 năm 2020 Sinh viên NGUYỄN QUANG HUY iii MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii MỤC LỤC iii DANH MỤC TỪ VIẾT TẮT vi DANH MỤC CÁC BẢNG vii DANH MỤC CÁC HÌNH viii MỞ ĐẦU .1 CHƯƠNG TỔNG QUAN VỀ NHẬN DIỆN KHUÔN MẶT 1.1 Tổng quan nhận diện khuôn mặt với ứng dụng thực tế kỹ thuật nhận dạng khuôn mặt 1.1.1 Tổng quan 1.1.2 Kiến trúc tổng quát hệ thống nhận diện 1.1.3 Ứng dụng .3 1.2 Một số phương pháp nhận diện khuôn mặt thường áp dụng thực tế nghiên cứu .4 1.2.1 Phân tích thành phần (PCA) .4 1.2.2 Phân tích khác biệt tuyến tính(LDA) 1.2.3 Cây định (Decision Tree) 1.2.4 Mạng nơ-ron nhân tạo 15 1.2.5 Mạng nơ-ron tích chập .21 1.3 Phương pháp xác định vị trí khn mặt với mạng tích chập MTCNN 27 1.3.1 Giới thiệu 27 1.3.2 Cấu trúc mạng P-Net 27 1.3.3 Cấu trúc mạng R-Net .28 1.3.4 Cấu trúc mạng O-Net .30 iv 1.3.5 Đánh giá 31 1.4 Kết luận 31 CHƯƠNG HỆ THỐNG NHẬN DIỆN KHUÔN MẶT DỰA TRÊN MẠNG NƠ RON TÍCH CHẬP 32 2.1 Sơ đồ thiết kế hệ thống nhận diện khuôn mặt 32 2.2 Mạng Inception-ResNet sử dụng cho việc trích chọn đặc trưng khn mặt 33 2.2.1 Giới thiệu 33 2.2.2 Mạng GoogleNet 34 2.2.3 Mạng ResNet 36 2.2.4 Mạng Inception-ResNet 40 2.3 Rừng ngẫu nhiên 47 2.3.1 Giới thiệu 47 2.3.2 Kiến trúc 47 2.3.3 Quá trình bootstrapping 48 2.3.4 Quá trình attribute sampling 48 2.3.5 Kết dự đoán .49 2.3.6 Tham số Random Forest 49 2.3.7 Sử dụng random forest để phân loại, định danh cho khuôn mặt 49 2.4 Kết luận 50 CHƯƠNG THỬ NGHIỆM VÀ ĐÁNH GIÁ .51 3.1 Bộ liệu đầu vào 51 3.2 Quá trình huấn luyện .51 3.3 Thử nghiệm chạy hệ thống nhận diện khuôn mặt nhận diện khách hàng VIP khách sạn 53 3.4 Đánh giá 55 3.5 Kết luận 58 v KẾT LUẬN .59 DANH MỤC CÁC TÀI LIỆU THAM KHẢO 60 vi DANH MỤC TỪ VIẾT TẮT Tên viết tắt Tiếng Anh Tiếng Việt DT Decision Tree Cây định ID3 Iterative Dichotomiser Thuật toán ID3 RF Random Forest Rừng ngẫu nhiên MLP Multi layer perceptron Mạng nơ-ron truyền thẳng nhiều lớp Mạng nơ-ron tích chập CNN Convolutional Neural Network PCA Principal Components Analysis Phân tích thành phần LDA Linear Discriminant Analysis Phân tích khác biệt tuyến tính MLP Multilayer perceptron Mạng nơron truyền thẳng nhiều lớp ANN Artificial Neural network Mạng nơron nhân tạo vii DANH MỤC CÁC BẢNG Bảng 1.1 Các hàm kích hoạt 16 Bảng 2.1 Bảng đánh giá độ xác mơ hình 56 viii DANH MỤC CÁC HÌNH Hình 1.1 Kiến trúc tổng quát hệ thống nhận diện Hình 1.2 Thành phần định Hình 1.3 Đồ thị hàm entropy 10 Hình 1.4 Cấu tạo Perceptrons 15 Hình 1.5 Cấu trúc nơ-ron nhân tạo 16 Hình 1.6 Cấu tạo mạng truyền thẳng 19 Hình 1.7 Cấu tạo mạng MLP .19 Hình 1.8 Kiến trúc mạng CNN 22 Hình 1.9 Ví dụ lớp gộp cực đại 23 Hình 1.10 Đồ thị hàm f(θ) thuật tốn Gradient Descent 24 Hình 1.11 Mối liên hệ tốc độ huấn luyện hàm 𝐽(𝜃) thuật toán Momentum 24 Hình 1.12 Kiến trúc mạng P-Net 28 Hình 1.13 Kiến trúc mạng R-Net .29 Hình 1.14 Kiến trúc mạng O-Net .30 Hình 2.1 Sơ đồ hoạt động hệ thống nhận diện khuôn mặt 32 Hình 2.2 Hình 2.1 Khối Inception 34 Hình 2.3 Kiến trúc mạng GoogletNet 35 Hình 2.4 Kiến trúc mạng nơ-ron 37 Hình 2.5 Kiến trúc khối phần dư 38 Hình 2.6 Kiến trúc mạng Resnet 39 Hình 2.7 Kiến trúc mạng Inception-ResNet 41 Hình 2.8 Khối STEM .42 Hình 2.9 Khối Inception-A 43 Hình 2.10 Khối Inception-B .44 Hình 2.11 Khối Inception-C .45 Hình 2.12 Khối Reduction A 46 Hình 2.13 Khối Reduction B 46 47 Khối reduction B gồm nhánh xử lý song song bao gồm nhánh thứ sở hữu tầng gộp cực đại Nhánh thứ hai gồm hai tầng tích chập 1x1 3x3 Nhánh thứ ba gồm ba tương tự nhánh thứ hai khác số lượng lọc vào tầng 3x3.Nhánh thứ tư bao gồm tầng tích chập xếp chồng 1x1, 3x3, 3x3 Tại tầng cuối nhánh sử dụng stride để giảm depth 2.3 Rừng ngẫu nhiên 2.3.1 Giới thiệu Rừng ngẫu nhiên (Random Forest) hay gọi rừng định ngẫu nhiên kỹ thuật học tập sử dụng để giải nhiệm vụ học tập có giám sát phân loại hồi quy Một tính ưu việt rừng ngẫu nhiên khắc phục khớp (overfitting) tập liệu đào tạo 2.3.2 Kiến trúc Kiến trúc mơ hình rừng ngẫu nhiên tập hợp nhiều định Mỗi định trả kết dự báo Ngoài mơ hình chạy nhiều sub-sample Hình 2.14 Kiến trúc rừng ngẫu nhiên 48 Ý tưởng Random Forest đơn giản Thuật toán sinh số định (thường vài trăm) sử dụng chúng [12] câu hỏi định câu hỏi thuộc tính Ví dụ: “Cánh hoa có dài 1.7cm hay không?” Câu giá trị nút lớp (class) Sử dụng hàng trăm định bất khả thi với người, máy tính làm việc tương đối dễ dàng Những thực đào tạo phần khác tập huấn luyện Về mặt kỹ thuật, riêng lẻ trồng sâu có xu hướng học hỏi từ mẫu khó đốn Loại tạo vấn đề mức huấn luyện Hơn nữa, độ lệch thấp làm cho trình phân loại có hiệu suất thấp chất lượng liệu bạn tốt mặt tính 2.3.3 Q trình bootstrapping Rừng ngẫu nhiên sử dụng hàng trăm hàng ngàn định tất dựng theo cách, chúng cho câu trả lời giống Như chẳng khác sử dụng định Từ đó, Rừng ngẫu nhiên sử dụng bootstrapping để giải vấn đề Quá trình bootstrapping rừng ngẫu nhiên sử dụng thuật toán chọn ngẫu nhiên quan sát (observations) để đảm bảo tất định cho câu trả lời Cụ thể rừng ngẫu nhiên thực xoá số quan sát lặp lại số khác cách ngẫu nhiên khiến định có thay đổi riêng 2.3.4 Quá trình attribute sampling Để chắn định tạo hoàn toàn khác nhau, rừng ngẫu nhiên sử dụng thêm kỹ thuật lấy mẫu thuộc tính (attribute sampling) Rừng ngẫu nhiên thực trình attribute sampling cách loại bỏ ngẫu nhiên số câu hỏi xây dựng định Điều giúp tạo nên tính ngẫu nhiên cho thuật tốn Trường hợp câu hỏi tốt bị loại bỏ câu hỏi khác thay từ định hoàn toàn xây dựng 49 2.3.5 Kết dự đoán Random Forest thuật tốn thuộc lớp mơ hình kết hợp (ensemble model) Kết thuật toán dựa bầu cư đa số từ nhiều định Do mơ hình có độ tin cậy cao độ xác tốt so với mơ hình phân loại tuyến tính đơn giản logistic linear regression 2.3.6 Tham số Random Forest Các tham số thường sử dụng huấn luyện random forest n_estimators, max_depth, min_samples_split, max_features, max_features, class_weight, min_impurity_split Trong n_estimators số lượng trees định Tham số max_depth độ sâu lớn định Tham số min_samples_split số lượng mẫu tối thiểu cần thiết để phân chia internal node Nếu kích thước mẫu internal node nhỏ ngưỡng ta không rẽ nhánh internal node Tham số max_features số lượng đặc trưng xem xét tìm kiếm phương án phân chia tốt Mặc định toàn đặc trưng đầu vào Tham số class_weight trọng số tương ứng với lớp Mặc định None, lớp có mức độ quan trọng Tham số min_impurity_split ngưỡng để dừng sớm (early stopping) trình phát triển định Nó tiếp tục phân chia độ vẩn đục (impurity) lớn ngưỡng, trái lại node leaf 2.3.7 Sử dụng random forest để phân loại, định danh cho khn mặt Đối với tốn nhận diện khuôn mặt nhiều nghiên cứu cho thấy Random forest đem lại kết tốt hai việc trích chọn đặc trưng phân loại khn mặt [13] Trong khuôn khổ luận này, random forest áp dụng cho việc phân loại khuôn mặt Dữ liệu ảnh sau qua mơ hình tích chập Inception-ResNet trả cho kết vectơ đặc trưng Ta sử dụng random forest để huấn luyện vectơ đặc trưng với nhãn tương ứng Sau kết thúc huấn luyện ta thu mơ hình phân loại Mơ hình phân loại sử dụng thực với liệu đầu vào vectơ đặc trưng trả lại nhãn với xác suất tương 50 ứng với vectơ đặc trưng đầu vào Từ ta xác định khuôn mặt đầu vào giống với 2.4 Kết luận Chương trình bày sơ đồ thiết kế hệ thống nhận diện khuôn mặt, mạng trích chọn đặc trưng kỹ thuật phân loại rừng ngẫu nhiên Trong đó, nội dung chương có sâu mạng học sâu googlenet, resnet từ đưa ưu nhược điểm kết hợp hai mạng thành mạng inception resnet Chương trình bày kết thu sử dụng mạng inception resnet kết hợp với rừng ngẫu nhiên cho tốn nhận diện khn mặt 51 CHƯƠNG THỬ NGHIỆM VÀ ĐÁNH GIÁ 3.1 Bộ liệu đầu vào Bộ liệu sử dụng luận văn hai liệu faces94 [10] CASIA-WebFace [20] Trong liệu faces94 thu thập từ trung tâm nghiên cứu Center for Machine Perception thuộc đại học kỹ thuật Séc liệu CASIA-WebFace sưu tầm từ viện tự động hóa học viện khoa học Trung Quốc(CASIA) Luận văn sử dụng hai liệu vào mục đích khác Bộ liệu faces94 chứa khoảng 1300 ảnh 153 người Đây liệu nhỏ dùng để thử nghiệm đánh giá hiệu kiến trúc mạng trước sử dụng liệu để huấn luyện Bộ liệu CASIA-WebFace chứa khoảng 500.000 ảnh thu thập từ 10.000 người Trước đưa vào huấn luyện cho mơ hình trích chọn đặc trưng ảnh duyệt qua mơ hình mtcnn để xác định vị trí tọa độ khuôn mặt người tập liệu 3.2 Q trình huấn luyện Sau có liệu đầu vào khuôn mặt Ta tiến hành huấn luyện mạng Inception-ResNet với hàm tối ưu sử dụng adagrad Vì adagrad hàm tối ưu tự điều chỉnh tốc độ học Với người kinh nghiệm toán việc lựa chọn mơ hình kèm với phương pháp tối ưu cần truyền vào tốc độ học khó khăn tốn thời gian, cơng sức để đánh giá nên em định sử dụng adagrad Adagrad coi tốc độ học tham số điều chỉnh tốc độ học cho learning nhỏ mà liệu khác biệt tốc độ học liệu nhiều khác biệt Việc tự điều chỉnh tốc độ học hàm tối ưu giúp mô hình ta dễ dàng sử dụng Hàm mục tiêu sử dụng nghiên cứu cross-entropy-loss Để cho mơ hình học tốt ta tiến hành sử dụng phương pháp tăng cường liệu qua tham số random_rotate, random_flip, random_crop 52 Hình 3.1 Một số phương pháp tăng cường liệu Trong random_crop cắt ngẫu nhiên phần ảnh giúp mơ hình tránh việc học khớp Tham số random_flip lật ảnh Bức ảnh lật ngẫu nhiên sang trái phải Tham số random_rotate tăng cường liệu ảnh xoay từ ảnh gốc với thiết lập góc 10 độ sang trái phải Một mơ hình trích chọn đặc trưng tốt liệu đủ lớn đa dạng để việc học hạn chế rơi vào tình trạng khớp Các phương pháp tăng cường liệu áp dụng hai liệu faces94 CASIA-WebFace trình huấn luyện Quá trình huấn luyện áp dụng số kiến trúc mạng với tập liệu faces94 để đánh giá hiệu trước huấn luyện thật liệu CASIA-WebFace Các liệu đưa qua mơ hình mtcnn để xác định vị trí khn mặt trước đưa vào huấn luyện Kiến trúc áp dụng để huấn luyện với faces94 Inception-Resnet nguyên Inception-Resnet sau cắt bỏ hai tầng Inception-C Dữ liệu faces94 tách làm hai phần huấn luyện kiểm thử với tỉ lệ 7:3 Thời gian huấn luyện cho lần duyệt(epoch) khoảng 15 phút với liệu faces94 tăng sau khoảng 35 epoch hai mạng hội tụ độ xác khơng cịn tăng lỗi khơng giảm tiếp tục huấn luyện Kết đánh giá tập test cho thấy với mạng Inception-Resnet nguyên độ xác 99.87% mạng Inception-Resnet sau cắt bỏ hai tầng Inception-C 53 97.68% Thử nghiệm cho thấy kết mạng Inception-Resnet nguyên hiệu Ta thấy mạng không đủ độ sâu mạng Inception-Resnet sau điều chỉnh khả học bị rõ rệt độ xác có 97,68% tập liệu nhỏ, đơn giản khó để huấn luyện mơ hình tốt với liệu lớn Từ đánh giá trên, kiến trúc mạng Inception-Resnet nguyên sử dụng để huấn luyện mô hình trích chọn đặc trưng Dữ liệu sử dụng cho việc huấn luyện CASIA-WebFace Đây tập liệu khuôn mặt lớn thu thập từ học viện khoa học Trung Quốc Để có mơ hình trích chọn đặc trưng thật tốt số lượng liệu khn mặt phải đủ lớn, đủ độ đa dạng vè hình dáng, kích thước màu sắc Thời gian diễn khoảng 350 với 90 lần duyệt Sau có mơ hình trích chọn đặc trưng tùy vào tốn ta tiến hành trích chọn đặc trưng nhãn đầu vào để mơ hình phân loại thuật tốn random forest học đặc tính 3.3 Thử nghiệm chạy hệ thống nhận diện khuôn mặt nhận diện khách hàng VIP khách sạn Máy chủ sử dụng cho việc thực nghiệm sử dụng vi xử lý Intel Core i58400 với xung nhịp 2.8GHz Dung lượng nhớ 16 GB xử lý đồ họa sử dụng GTX 1070 Ti 8G GDDR5 Hệ thống nhận diện khách hàng VIP phát triển tảng Ubuntu ngơn ngữ lập trình sử dụng python version 3.6 với thư viện opencv, keras, tensorflow để phục vụ cho toán xử lý ảnh Mơ hình thử nghiệm huấn luyện với tập liệu khoảng 200 khách hàng, vị khách có khoảng 10-30 ảnh khuôn mặt sở liệu Trong trình phân loại em chọn ngưỡng 40% để xác định khuôn mặt Ngưỡng sử dụng sử dụng để tránh việc xác suất khuôn mặt trả thấp gây việc nhận nhầm thông tin Sau thiết lập địa luồng phát video trực tiếp ta khởi động hệ thống Sau số hình ảnh hệ thống hoạt động : 54 Hình 3.2 Hệ thống nhận diện khn bình thường 55 Hình 3.3 Hệ thống nhận diện khn mặt có đeo kính Với khách hàng có danh sách sau xuất lưu lại 10 giây để dễ dàng quan sát Hệ thống nhận diện khn mặt cách bình thường người đeo kính Từ thấy mơ hình trích rút đặc trưng mơ hình phân loại hoạt động tốt thực tế Hệ thống nhận diện khách hàng giây xử lý khung hình với độ phân giải fullhd 3.4 Đánh giá Để đánh phân loại ta thực lấy vectơ đặc trưng từ mơ hình trích chọn đặc trưng đưa vào randomforest để huấn luyện Thiết lập random forest 56 em 100 Các tập liệu sử dụng để đánh giá luận văn Faces94 [14], Faces95[15], Faces96[16], Grimace[17] Tập liệu dùng 75% cho việc huấn luyện 25% lại cho việc kiểm thử mơ hình phân loại Sau ta so sánh kết mơ hình vừa huấn luyện với kết số phương pháp sử dụng tron nghiên cứu [18] [19] LDA, PCA, LBP, SVM based on LDA MLP kết hợp với PCA DCT Bảng 2.1 Bảng đánh giá độ xác mơ hình Faces94 Faces95 Faces96 Grimace dataset dataset dataset dataset 99.1% 99.5% 98.2% 99.95 100% - - 100% SVM based on LDA (RBF kernel) 97.4% - 95.1% 100 % LBP 85.93% 80.47% 84.145 86.45% PCA 72.1% 69.87% 70.95% 74.79% LDA 79.39% 76.61% 78.34% 81.93% Inception Resnet V1+ Random forest Multilayer perceptron + PCA + DCT Sự kết hợp hai mơ hình Inception Resnet V1 Random forest cho lại kết cao với tập liệu Sự khác biệt lớn phương pháp việc trích chọn đặc trưng Mạng Inception Resnet V1 học đặc trưng khuôn mặt tốt hẳn so với phương pháp học máy truyền thống Kiến trúc mạng tích chập có khả học đặc trưng tốt trích rút đặc trưng khn mặt trường hợp thiếu sáng, khuôn mặt không đầy đủ hay người đeo kính Dựa kết ta thấy phương pháp học máy SVM đem lại kết ấn tượng kết cao lại Inception Resnet V1 + Random forest MLP + PCA + DCT Chúng ta đánh giá chi tiết ưu nhược điểm 57 hai phương pháp Dựa vào kết ta thấy việc kết hợp nhiều phương pháp MLP, PCA DCT đem đến hiệu tốt với mức độ xác ln Inception Resnet V1 Random forest từ 0.1-1% Hình 3.4 Luồng xử lý hệ thống sử dụng phương pháp PCA DCT Đánh giá qua mơ hình ta thấy hai phương pháp kết hợp học máy học sâu Trong hai thiết kế, thiết kế sử dụng học máy để trích chọn đặc trưng dùng phương pháp học sâu để phân loại, thiết kế sử dụng học sâu để trích chọn đặc trưng dùng phương pháp học máy để phân loại Cả hai thiết kế dù đem lại kết nhận diện tốt thiết kế sử dụng MLP, PCA, DCT ta thấy thiết kế phức tạp mơ hình phân loại sử dụng mạng lan truyền ngược lớn Thời gian tối thiểu để nhận diện khuôn mặt rơi vào khoảng 20 giây Đó khoảng thời gian q lớn phương pháp sử dụng nhiều kỹ thuật 58 Hình 3.5 Luồng xử lý hệ thống Inception Resnet Random forest Còn lại với Inception Resnet V1 kết hợp với Random forest cho ta độ xác thấp khoảng 1% so với phương pháp thời gian để nhận diện khuôn mặt rơi vào khoảng 0.2 giây Từ ta thấy phương pháp sử dụng mạng Inception Resnet V1 kết hợp với Random forest dễ dàng triển khai thực tế dù độ xác từ phương pháp đem lại thấp PCA kết hợp với DCT chút 3.5 Kết luận Chương trình bày trình huấn luyện, kiểm thử, đánh giá chất lượng mơ hình trích chọn đặc trưng inception resnet thử nghiệm chạy hệ thống nhận diện khách hàng VIP khách sạn Kết hệ thống tốt với thời gian xử lý khoảng 0.2 giây khung hình với khả nhận diện khn mặt từ nhiều góc độ, sắc thái, điều kiện khác nhau, điều mà mơ hình học máy truyền thống chưa xử lý tốt 59 KẾT LUẬN Bài tốn nhận diện khn mặt khơng cịn vấn đề nhận diện khuôn mặt dựa mạng học sâu quan tâm Trên sở tìm hiểu nghiên cứu phương pháp nhận diện khuôn mặt áp dụng vào hệ thống nhận diện khuôn mặt qua camera, luận văn đạt kết sau Đó tìm hiểu, thực nghiệm mơ hình mạng học sâu, học máy nơron tích chập rừng ngẫu nhiên để xử lý tốn nhận diện Phân tích kết thu tìm mơ hình mạng học sâu thích hợp cho tốn nhận diện khn mặt Xây dựng thành cơng hệ thống nhận diện khn mặt qua camera có chức phát khuôn mặt trực tiếp qua video Hệ thống sau phát triển cho thấy việc mơ hình mạng trích chọn đặc trưng đem tới kết tốt nhiên xuất số mặt hạn chế Đó mơ hình phân loại không phù hợp với tập liệu lớn Điều kết phân loại mà thời gian huấn luyện lại mô hình phân loại lâu Qua kết hạn chế ứng dụng cho thấy việc xây dựng hệ thống nhận diện khn mặt cịn địi hỏi phải thực hiện, nghiên cứu áp dụng thêm nhiều phương pháp Về hướng pháp triển tương lại, luận văn đề xuất nghiên cứu thêm số hướng Hướng thứ tiến hành nghiên cứu, áp dụng đánh giá mơ hình phân loại áp dụng vào toán thay rừng ngẫu nhiên Sparse Representation-based classification, Support Vector Machine, Linear Classifier Hướng nghiên cứu số phương pháp sử dụng khoảng cách huấn luyện với triplet loss Phương pháp cần dung lượng nhớ lớn không cần huấn luyện sử dụng mơ hình phân loại Do thời gian thực luận văn không nhiều nên chắn luận văn tránh khỏi hạn chế thiếu sót Em mong nhận ý kiến đóng góp 60 DANH MỤC CÁC TÀI LIỆU THAM KHẢO [1] Abdulrahman Alkandari, Soha Jaber Aljaber (2015), “Principle Component Analysis algorithm (PCA) for image recognition”, ICCTIM, pp 76-80 [2] Liton Chandra Paul, Abdulla Al Sumam (2012), “Face Recognition Using Principal Component Analysis Method” International Journal of Advanced Research in Computer Engineering & Technology (IJARCET) 1, pp 135-139 [3] LDA Juwei Lu, Kostantinos N Plataniotis, and Anastasios N Venetsanopoulos (2003), "Face Recognition Using LDA-Based Algorithms", IEEE TRANSACTIONS ON NEURAL NETWORKS, pp 195-200 [4] Alaa Eleyan, Hasan Demirel (2006), “PCA and LDA Based Face Recognition Using Feedforward Neural Network Classifier” Conference: Multimedia Content Representation, pp 200-206 [5] Philip H Swain, Hans Hauska (1977), “The decision tree classifier: Design and potential” IEEE Transactions on Geoscience Electronics 15, pp 142-147 [6] Georgios Karalis (2020), “Decision Trees and Applications” Advances in Experimental Medicine and Biology 1194, pp 239-242 [7] Manish Mishra, Monika Srivastava (2014), “A view of Artificial Neural Network”, IEEE ICAETR - 2014, pp 1-3 [8] Saad Albawi, Tareq Abed Mohammed (2017), “Understanding of a Convolutional Neural Network”, International Conference on Engineering and Technology (ICET) [9] Yushi Chen, Hanlu Jiang, Chunyang Li, Xiuping Jia, Pedram Ghamisi (2016), “Deep Feature Extraction and Classification of Hyperspectral Images Based on Convolutional Neural Networks” IEEE Transactions on Geoscience and Remote Sensing 54, pp 6232 6251 [10] Musab Cokun, Ayegỹl Uỗar, Özal Yildirim, Yakup Demir (2017), “Face recognition based on convolutional neural network” 2017 International Conference on Modern Electrical and Energy Systems (MEES), pp 376-379 61 [11] Kaiming He, Xiangyu Zhang, Shaoqing Ren, Jian Sun (2016), “Deep Residual Learning for Image Recognition” 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), pp 770-778 [12] Jehad Ali, Rehanullah Khan, Nasir Ahmad (2012), “Random Forests and Decision Trees” JCSI International Journal of Computer Science Issues 9, pp 272276 [13] Haiyan Guan, Jonathan Li (2012), “RANDOM FORESTS-BASED FEATURE SELECTION FOR LAND-USE CLASSIFICATION USING LIDAR DATA AND ORTHOIMAGERY” ISPRS - International Archives of the Photogrammetry Remote Sensing and Spatial Information Sciences, pp 203-208 [14] Faces94, http://cmp.felk.cvut.cz/~spacelib/faces/faces94.html Truy cập ngày 01/11/2020 [15] Faces95, http://cmp.felk.cvut.cz/~spacelib/faces/faces95.html Truy cập ngày 01/11/2020 [16] Faces96, http://cmp.felk.cvut.cz/~spacelib/faces/faces96.html Truy cập ngày 01/11/2020 [17] Grimace, http://cmp.felk.cvut.cz/~spacelib/faces/grimace.html Truy cập ngày 01/11/2020 [18] A Vinay, Abhijay Gupta, Aprameya Bharadwaj, Arvind Srinivasan, K N Balasubramanya Murthy, S Natarajan (2018),"Deep Learning on Binary Patterns for Face Recognition", International Conference on Computational Intelligence and Data Science, pp 77-83 [19] Nawaf Hazim (2016), "Face Recognition using PCA-BPNN with DCT Implemented on Face94 and Grimace Databases", International Journal of Computer Applications, pp 8-13 [20] CASIA-WebFace, https://pgram.com/dataset/casia-webface/ Truy cập ngày 01/11/2020 ... QUAN VỀ NHẬN DIỆN KHUÔN MẶT 1.1 Tổng quan nhận diện khuôn mặt với ứng dụng thực tế kỹ thuật nhận dạng khuôn mặt 1.1.1 Tổng quan 1.1.2 Kiến trúc tổng quát hệ thống nhận. .. nhận diện khuôn mặt có ý nghĩa thực tiễn sống em xin chọn đề tài nghiên cứu ? ?Hệ thống nhận diện khuôn mặt qua camera? ?? Kết luận văn hướng tới việc xây hệ thống nhận diện khuôn mặt có khả mở khả... sáng tối, sáng, mờ hay ảnh chứa phần khuôn mặt 1.4 Kết luận Chương giới thiệu tổng quan nhận diện khuôn mặt, kiến trúc hệ thống nhận diện khuôn mặt ứng dụng hệ thống thực tế Bên cạnh nội dung chương

Ngày đăng: 20/03/2021, 06:30

Tài liệu cùng người dùng

Tài liệu liên quan