(Đồ án tốt nghiệp) Xây dựng hệ thống nhận diện khuôn mặt và cảm xúc dùng mạng Nơ Ron tích chập(Đồ án tốt nghiệp) Xây dựng hệ thống nhận diện khuôn mặt và cảm xúc dùng mạng Nơ Ron tích chập(Đồ án tốt nghiệp) Xây dựng hệ thống nhận diện khuôn mặt và cảm xúc dùng mạng Nơ Ron tích chập(Đồ án tốt nghiệp) Xây dựng hệ thống nhận diện khuôn mặt và cảm xúc dùng mạng Nơ Ron tích chập(Đồ án tốt nghiệp) Xây dựng hệ thống nhận diện khuôn mặt và cảm xúc dùng mạng Nơ Ron tích chập(Đồ án tốt nghiệp) Xây dựng hệ thống nhận diện khuôn mặt và cảm xúc dùng mạng Nơ Ron tích chập(Đồ án tốt nghiệp) Xây dựng hệ thống nhận diện khuôn mặt và cảm xúc dùng mạng Nơ Ron tích chập(Đồ án tốt nghiệp) Xây dựng hệ thống nhận diện khuôn mặt và cảm xúc dùng mạng Nơ Ron tích chập(Đồ án tốt nghiệp) Xây dựng hệ thống nhận diện khuôn mặt và cảm xúc dùng mạng Nơ Ron tích chập(Đồ án tốt nghiệp) Xây dựng hệ thống nhận diện khuôn mặt và cảm xúc dùng mạng Nơ Ron tích chập(Đồ án tốt nghiệp) Xây dựng hệ thống nhận diện khuôn mặt và cảm xúc dùng mạng Nơ Ron tích chập(Đồ án tốt nghiệp) Xây dựng hệ thống nhận diện khuôn mặt và cảm xúc dùng mạng Nơ Ron tích chập(Đồ án tốt nghiệp) Xây dựng hệ thống nhận diện khuôn mặt và cảm xúc dùng mạng Nơ Ron tích chập(Đồ án tốt nghiệp) Xây dựng hệ thống nhận diện khuôn mặt và cảm xúc dùng mạng Nơ Ron tích chập(Đồ án tốt nghiệp) Xây dựng hệ thống nhận diện khuôn mặt và cảm xúc dùng mạng Nơ Ron tích chập(Đồ án tốt nghiệp) Xây dựng hệ thống nhận diện khuôn mặt và cảm xúc dùng mạng Nơ Ron tích chập(Đồ án tốt nghiệp) Xây dựng hệ thống nhận diện khuôn mặt và cảm xúc dùng mạng Nơ Ron tích chập(Đồ án tốt nghiệp) Xây dựng hệ thống nhận diện khuôn mặt và cảm xúc dùng mạng Nơ Ron tích chập(Đồ án tốt nghiệp) Xây dựng hệ thống nhận diện khuôn mặt và cảm xúc dùng mạng Nơ Ron tích chập
TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT TPHCM KHOA ĐÀO TẠO CHẤT LƯỢNG CAO ĐỒ ÁN TỐT NGHIỆP XÂY DỰNG HỆ THỐNG NHẬN DIỆN KHUÔN MẶT VÀ CẢM XÚC DÙNG MẠNG NƠ-RON TÍCH CHẬP SVTH : NGUYỄN VĂN PHÚC MSSV : 16141071 Khóa : 2016 Nghành : CƠNG NGHỆ KỸ THUẬT ĐIỆN TỬ - TRUYỀN THÔNG GVHD : GVC-THS NGUYỄN NGƠ LÂM Tp Hồ Chí Minh, tháng năm 2020 TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT TPHCM KHOA ĐÀO TẠO CHẤT LƯỢNG CAO ĐỒ ÁN TỐT NGHIỆP XÂY DỰNG HỆ THỐNG NHẬN DIỆN KHUÔN MẶT VÀ CẢM XÚC DÙNG MẠNG NƠ-RON TÍCH CHẬP SVTH : NGUYỄN VĂN PHÚC MSSV : 16141071 Khóa : 2016 Nghành : CƠNG NGHỆ KỸ THUẬT ĐIỆN TỬ - TRUYỀN THÔNG GVHD : GVC-THS NGUYỄN NGƠ LÂM Tp Hồ Chí Minh, tháng năm 2020 LỜI CẢM ƠN Để hoàn thành đồ án tốt nghiệp có kiến thức quý giá trình thực hiện, cá nhân em nhận nhiều giúp đỡ, quan tâm từ Thầy Cơ gia đình bạn bè Đầu tiên em xin chân thành gửi lời cảm ơn đến Thầy ThS Nguyễn Ngô Lâm giáo viên hướng dẫn đồ án trực tiếp em, thầy nhiệt tình dẫn, truyền đạt kiến thức, kinh nghiệm cho em để em hoàn thành đồ án tốt nghiệp Em xin chân thành cảm ơn đến Thầy Cô nghành công nghệ kỹ thuật điện tử truyền thông thuộc khoa đào tạo chất lượng cao khoa điện – điện tử nói riêng Trường Đại Học Sư Phạm Kỹ Thuật TP Hồ Chí Minh nói chung dùng tâm huyết để truyền đạt kiến thức quý báu cho em suốt trình học tập trường Và cuối em xin gửi lời cảm ơn đến gia đình, người thân, bạn bè em động viên hỏi thăm em suốt trình làm đồ án tốt nghiệp Do thời gian thực đồ án có hạn, em cố gắng để hồn thành khóa luận tốt khơng thể tránh trường hợp thiếu sót trình làm đồ án tốt nghiệp, em mong nhận cảm thông bảo Thầy Cô bạn bè Em xin chân thành cảm ơn ! vi TÓM TẮT Hiện thị giác máy tính trở thành hướng nghiên cứu sơi từ nhà nghiên cứu tồn giới nói chung Việt Nam nói riêng Các hướng nghiên cứu thị giác máy tính phân loại dựa sở ứng dụng Nhận dạng khuôn mặt cảm xúc đề tài nghiên cứu ứng dụng nhiều nơi, đặc biệt nghành an ninh đánh giá tâm trạng mức độ hài lòng người tiêu dùng sản phẩm thương hiệu họ giới kỹ thuật số Bên cạnh việc ứng dụng nhận dạng cảm xúc thực tế lớn như: Các hệ thống sử dụng rô bốt điều khiển cảm xúc, thiết bị hỗ trợ người tàn tật,… Việc nhận dạng khuôn mặt cảm xúc thực với đối tượng đầu vào hình ảnh video có nhiều khn mặt chụp từ camera Sau đó, hình ảnh chứa khn mặt tiền xử lý loại nhiễu, cân độ sáng… Một số kỹ thuật trích xuất đặc trưng sử dụng để lấy thành phần riêng khuôn mặt Tất khuôn mặt riêng lưu trữ sở liệu để phục vụ cho việc gắn nhãn trình nhận dạng tùy theo ứng dụng Đối với nhận dạng cảm xúc, ảnh video đưa vào hệ thống để tiến hành nhận dạng cảm xúc Hệ thống tiến hành nhận dạng loại cảm xúc gồm có: “ vui vẻ ”, “ buồn ”, “ sợ hãi ”, “ khó chịu ”, “ giận ”, “ ngạc nhiên ” “ bình thường ” Đề tài “ Xây dựng hệ thống nhận diện khuôn mặt cảm xúc dùng mạng nơ-ron tích chập ” xây dựng với hai mục đích nhận diện khn mặt nhận diện cảm xúc Đối với hệ thống nhận diện khuôn mặt, cá nhận thực đề tài sử dụng hai loại tập mẫu Tập mẫu thứ dựa tập mẫu có sẵn [22], tập mẫu thứ hai cá nhân thực thu thập từ camera điện thoại với nam bao gồm 2000 ảnh lấy mẫu với nhiều kịch khác Đặc trưng Haar-like sử dụng để phát khuôn mặt với trợ giúp thư viện OpenCV Mạng nơ-ron tích chập huấn luyện trước với loại tập mẫu sau kết loại tập mẫu so sánh với Mơ vii hình mạng nơ-ron tích chập sau huấn luyện nạp vào kit Raspberry Pi với camera kết nối nhằm nhận dạng đối tượng theo thời gian thực với liệu huấn luyện từ trước Đối với hệ thống nhận dạng cảm xúc, cá nhân thực đề tài sử dụng tập liệu hình ảnh cảm xúc FERC-2013 để làm sở liệu để huấn luyện mơ hình mạng nơ-ron tích chập Tập liệu huấn luyện đầu vào hình ảnh chứa khn mặt xử lý Những hình ảnh chứa khn mặt sau đưa vào mơ hình mạng nơ-ron tích chập truyền thống để tiến hành huấn luyện kiểm tra Mơ hình mạng nơ-ron tích chập sau huấn luyện ứng dụng để nhận dạng cảm xúc thông qua khuôn mặt từ camera Kết thực đồ án tốt nghiệp cho kết tương đối tốt bao gồm hai hệ thống nhận diện khn mặt cảm xúc Ngồi ra, kết thực nhận dạng cảm xúc cá nhân thực cho kết tốt kết công bố [1] Bên cạnh hệ thống đảm bảo tốc độ xử lý nhanh, cho phép giải toán nhận dạng khuôn mặt cảm xúc theo thời gian thực viii MỤC LỤC LỜI CẢM ƠN vi TÓM TẮT vii MỤC LỤC .ix DANH MỤC CÁC TỪ VIẾT TẮT xiii DANH MỤC BẢNG xv DANH MỤC HÌNH xvi CHƯƠNG : TỔNG QUAN 1.1 TÌNH HÌNH NGHIÊN CỨU 1.2 MỤC TIÊU ĐỀ TÀI 1.3 GIỚI HẠN ĐỀ TÀI 1.4 ĐỐI TƯỢNG NGHIÊN CỨU 1.5 PHẠM VI NGHIÊN CỨU 1.6 BỐ CỤC ĐỀ TÀI CHƯƠNG : CƠ SỞ LÝ THUYẾT 2.1 TỔNG QUAN VỀ QUÁ TRÌNH XỬ LÝ ẢNH 2.1.1 Xử lý ảnh 2.1.2 Điểm ảnh 2.1.3 Độ phân giải 2.1.4 Tăng cường ảnh 10 2.1.5 Khôi phục ảnh 10 ix 2.1.6 Phân tích ảnh 10 2.1.7 Nén liệu ảnh 11 2.1.8 Nhận dạng ảnh 11 2.2 KHUÔN MẶT VÀ CẢM XÚC 12 2.2.1 Đặc trưng mặt người 12 2.2.2 Phương pháp tiếp cận đặc trưng khuôn mặt 12 2.2.3 Biểu cảm khuôn mặt bày tỏ cảm xúc 13 2.3 MẠNG NƠ-RON TÍCH CHẬP 14 2.3.1 Mạng nơ-ron nhân tạo 14 2.3.2 Mạng nơ-ron tích chập 16 2.3.2.1 Mơ hình tổng quan 17 2.3.2.2 Các lớp mơ hình 18 2.3.3 Những vấn đề xảy với mơ hình mạng nơ-ron tích chập 23 2.3.3.1 Quá khớp (Overfiting) 23 2.3.3.2 Drop out 24 2.4 Giới thiệu máy tính nhúng kit Raspberry Pi 25 2.5 Xử lý ảnh với Python 28 2.5.1 Giới thiệu ngơn ngữ lập trình Python 28 2.5.2 Một số ưu điểm ngôn ngữ Python: 28 CHƯƠNG : XÂY DỰNG HỆ THỐNG NHẬN DIỆN KHUÔN MẶT VÀ CẢM XÚC DÙNG MẠNG NƠ-RON TÍCH CHẬP TRÊN KIT RASPBERRY PI 33 3.1 Yêu cầu hệ thống 33 x 3.2 Đặc tả hệ thống 33 3.3 Sơ đồ khối hệ thống 34 3.4 Thiết kế chi tiết hệ thống 35 3.4.1 Khối Camera 35 3.4.2 Khối xử lý Raspberry Pi 36 3.4.2.1 Hệ thống nhận dạng khuôn mặt 36 3.4.2.1.1 Sơ đồ trình xử lý hệ thống nhận dạng khuôn mặt 36 3.4.2.1.1.1 Tạo sở liệu ảnh 37 3.4.2.1.1.2 Phát khuôn mặt 39 3.4.2.1.1.3 Tiền xử lý 39 3.4.2.1.1.4 Trích chọn đặc trưng 40 3.4.2.1.1.5 Phân loại, nhận dạng 42 3.4.2.1.2 Mơ hình mạng nơ-ron tích chập dùng để mã hóa khn mặt43 3.4.2.2 Hệ thống nhận dạng cảm xúc 49 3.4.2.2.1 Lưu đồ xử lý hệ thống nhận dạng cảm xúc 49 3.4.2.2.2 Mơ hình mạng CNN dùng để nhận dạng cảm xúc 50 3.4.2.2.3 Tập liệu 51 3.4.2.2.3.1 Tập liệu mẫu có sẵn 51 3.4.2.2.3.2 Tập liệu riêng 53 3.4.2.2.4 Quá trình huấn luyện nhận dạng 55 3.4.2.2.4.1 Quá trình huấn luyện 55 xi 3.4.2.2.4.2 Quá trình nhận dạng 56 3.4.3 Khối hiển thị 57 CHƯƠNG : KẾT QUẢ 59 4.1 Mơ hình hồn chỉnh hệ thống 59 4.2 Giao diện hiển thị kết hệ thống 59 4.3 Kết hệ thống nhận dạng khuôn mặt 60 4.3.1 Phân tích nhận xét kết hệ thống nhận dạng khuôn mặt 60 4.3.1.1 Kết kiểm tra với tập liệu 61 4.3.1.2 Kết kiểm tra với tập liệu 62 4.3.2 Kết kiểm tra nhận dạng với số ảnh 62 4.4 Kết hệ thống nhận dạng cảm xúc 67 4.4.1 Kết huấn luyện nhận dạng 67 4.4.2 Kết kiểm tra nhận dạng với số ảnh 73 CHƯƠNG : KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 82 5.1 Kết đạt 82 5.2 Hướng phát triển 82 TÀI LIỆU THAM KHẢO 84 xii DANH MỤC CÁC TỪ VIẾT TẮT Số thứ tự Từ viết tắt 2D HOG Ý nghĩa từ viết tắt Dimenision: Hai chiều Histogram of Oriented Gradient: Phương pháp rút trích đặc trưng sử dụng thống kê histogram hướng ảnh gradient cho toán phát khuôn mặt ANN CNN Artificial Neural Network: Mạng nơ-ron nhân tạo Convolution Neural Network: Mạng nơ-ron tích chập FERC2013 Facial Expression Recognition Challenge: Cuộc thi “Thử thách nhận dạng cảm xúc khuôn mặt năm 2013” NN Neural Network: Mạng nơ-ron PE Processing Element: Phần tử xử lý PwC PricewaterhouseCoopers: Cơng ty kiểm tốn Mỹ RELU Rectified Linear Unit: Hàm đơn vị tuyến tính đứng xiii 4.4.2 Kết kiểm tra nhận dạng với số ảnh Nhận dạng cảm xúc loại cảm xúc nghiên cứu để tài với hình ảnh từ hình 4.7 đến hình 4.14 b) a) Hình 4.14: Nhận dạng cảm xúc “ bình thường ” Hình 4.14 miêu tả nhận dạng cảm xúc “ bình thường ” với độ xác cao đạt 77.95% 88.45% chi tiết biểu cảm cảm xúc “bình thường” khn mặt rõ ràng điều kiện môi trường cường độ ánh sáng thích hợp nên việc nhận dạng cho kết tương đối tốt 73 a) Hình 4.15: Nhận dạng cảm xúc “ vui vẻ ” b) Hình 4.15 miêu tả nhận dạng cảm xúc “ vui vẻ ” với độ xác lên đến 93.98% 99.36% Các chi tiết biểu cảm cảm xúc vui vẻ khuôn mặt chi tiết vùng miệng mở giãn rộng vùng mắt thay đổi tương đối, gị má nâng lên Hai mí mắt kéo lại gần Bên cạnh cường độ ánh sáng, cảm xúc dễ thực nhiều người vị trí đặt camera phù hợp nên hệ thống nhận dạng tương đối tốt a) b) Hình 4.16: Nhận dạng cảm xúc “ ngạc nhiên ” 74 Hình 4.16 miêu tả nhận dạng cảm xúc “ngạc nhiên” với độ xác đạt 67.6% 97.76% chi tiết biểu cảm cảm xúc “ngạc nhiên” khuôn mặt đạt mức độ tương đối rõ ràng để hệ thống nhận dạng lơng mày nâng lên cao, mắt mở to, hai mí mắt giãn xa đồng thời há miệng nên hệ thống nhận dạng có độ xác tương đối tốt so với tập mẫu huấn luyện.Bên cạnh cảm xúc dễ dàng thực với nhiều người Tuy nhiên vài chi tiết giống với cảm xúc“ sợ hãi ” vị trí lơng mày kéo lên, mí mắt kéo lên mí mắt căng nên dẫn đến có sai số dự đốn cảm xúc “ngạc nhiên” đạt xác 67.6% a) Hình 4.17: Nhận dạng cảm xúc “ buồn ” b) Hình 4.17 miêu tả nhận dạng cảm xúc “ buồn ” với độ xác đạt 63.47% 37.61% Đây cảm xúc biểu cảm khó biểu cảm với người với chi tiết biểu cảm cảm xúc khuôn mặt hai mí mắt khép lại gần , vùng má có thay đổi tương đối chi tiết vùng miệng khép lại đồng thời giãn Bên cạnh chi tiết biểu cảm dễ nhầm lần với cảm xúc “sợ hãi” vùng mí mắt miệng kéo sang hai bên Tuy nhiên việc nhận dạng cảm xúc buồn mang tính chất tương người Tùy theo người mà có biểu lộ cảm xúc buồn khác 75 a) Hình 4.18: Nhận dạng cảm xúc “ giận ” b) Hình 4.18 miêu tả nhận dạng cảm xúc “ giận ” với độ xác đạt 83.27% 77.18% với chi tiết biểu cảm cảm xúc khuôn mặt lông mày nâng lên cong hơn, nếp nhăn vùng mũi xuất hiện, trừng mắt, há miệng, hai mí mắt khép lại gần đồng thời chi tiết khn mặt có nhiều nếp nhăn Bên cạnh cường độ ánh sáng vị trí đặt camera giúp cho hệ thống nhận dạng có xác tốt a) Hình 4.19: Nhận dạng cảm xúc “ khó chịu ” b) Hình 4.19 miêu tả nhận dạng cảm xúc “khó chịu” với độ xác lên đạt 85.79% 56.46% Đây cảm xúc mà biểu cảm khuôn mặt hay gặp nhiều khó khăn nhận 76 dạng Các chi tiết biểu cảm mà tác giả thực nhíu mắt, nhăn mũi, mơi mơi miệng co khép lại, đồng thời nếp nhăn khuôn mặt vùng dọc theo mũi xuất nhiều Bên cạnh việc hệ thống nhận dạng có độ xác tương đối tốt ngồi chi tiết biểu cảm cảm xúc có vài chi tiết dễ nhầm lần với cảm xúc sợ hãi nên dẫn đến việc xảy sai số nhận dạng a) Hình 4.20: Nhận dạng cảm xúc “ sợ hãi ” b) Hình 4.20 miêu tả nhận dạng cảm xúc “ sợ hãi ” với độ xác đạt khoảng 45.82% 58.68% Đây biểu cảm khuôn mặt để hệ thống nhận dạng gặp nhiều khó khăn dễ nhầm lẫn với loại cảm xúc khác “buồn” “bình thường” Các chi tiết biểu cảm cảm xúc bao gồm lông mày kéo lên, mí mắt kéo lên, mí mắt căng Miệng thu hẹp, chi tiết vùng má có căng thẳng Nhận dạng cảm xúc sai số hình ảnh từ hình 4.21 đến hình 4.25 77 Hình 4.21: Nhận dạng cảm xúc “ bình thường ” thành cảm xúc “ buồn ” biểu cảm khơng rõ ràng Hình 4.21 Cảm xúc nhận dạng bị sai từ “bình thường ” thành “buồn” chi tiết biểu cảm không rõ ràng khn mặt hai mí mắt bị kéo xuống đồng thời xuất vài nếp nhăn tráng gây hệ thống dự đoán thêm cảm xúc “sợ hãi” 78 Hình 4.22: Nhận dạng cảm xúc “ bình thường ” thành cảm xúc “ sợ hãi ” cường độ sáng cao ảnh nhận dạng bị ngược sáng Hình 4.22 mơ tả hệ thống nhận dạng cảm xúc bị sai cường độ ánh sáng cao ảnh bị ngược sáng khiến cho chất lượng ảnh cần nhận dạng bị giảm Hình 4.23: Khơng nhận dạng khn mặt góc nghiêng đặc trưng khn mặt bị 79 Hình 4.23 mơ tả hệ thống không nhận dạng cảm xúc chi tiết đặc trưng khuôn mặt bị khuôn mặt bị nghiêng lớn dẫn đến không phát khuôn mặt để hệ thống nhận dạng cảm xúc Hình 4.24: Nhận dạng cảm xúc “ bình thường ” thành cảm xúc “ sợ hãi ” cường độ ánh sáng khn mặt yếu Hình 4.24 mơ tả cảm xúc nhận dạng bị sai cường độ ánh sáng yếu dẫn đến thay đổi chất lượng ảnh đầu vào để hệ thống nhận dạng cường độ ánh sáng yếu làm đặc trưng khuôn mặt khơng rõ ràng để hệ thống dự đốn cảm xúc xác 80 Hình 4.25: Nhận dạng cảm xúc “ bình thường ” thành cảm xúc “ buồn ” khn mặt bị thay đổi góc nghiêng đồng thời khn mặt khơng ngang tầm diện với camera Hình 4.25 mơ tả cảm xúc nhận dạng bị sai khn mặt bị thay đổi góc nghiêng, chi tiết biểu cảm khuôn mặt không bị Ngồi khn mặt khơng đặt nằm ngang vị trí diện với camera khoảng cách 1m Tất dẫn đến cường độ ánh sáng khuôn mặt bị giảm làm cho chất lượng chi tiết biểu lộ cảm xúc khuôn mặt không rõ ràng nên dẫn đến hệ thống nhận dạng cảm xúc bị sai Nhận xét: Trong trình nhận dạng cảm xúc , cảm xúc bị nhận dạng sai ảnh hưởng sau: - Điều kiện cường độ sáng thấp cao - Sự nhầm lẫn cảm xúc có đặc điểm tương đối giống - Biểu cảm không rõ ràng - Khn mặt khơng nằm ngang tầm diện với camera 81 CHƯƠNG : KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 5.1 Kết đạt Đối với hệ thống nhận dạng khuôn mặt, đề tài xây dựng hệ thống nhận dạng khuôn mặt dùng mạng nơ-ron tích chập chạy thành cơng cứng máy tính kit Raspberry Pi với liệu đầu vào ảnh, video có sẵn máy tính kit Raspberry Pi luồng video trực tuyến từ camera Hệ thống phát khuôn mặt xác minh danh tính đối tượng có tập liệu mẫu Với thơng số hiệu suất nhận dạng dựa hai tập liệu nêu đề tài kết nhận dạng tốt so với yêu cầu đặt Để thu kết nhận dạng tốt liệu cần phải tạo cách xác độ sáng, góc nhìn, hướng nghiêng cần phải tối ưu hóa cấu trúc thơng số mạng nơ-ron tích chập, điều địi hỏi thời gian thử nghiệm huấn luyện mạng lâu Đối với hệ thống nhận dạng cảm xúc, đề tài xây dựng huấn luyện thành công mô hình mạng nơ-ron tích chập với tập mẫu FERC-2013[2], dùng để nhận dạng cảm xúc thông qua khuôn mặt từ nguồn liệu đầu vào khác ảnh video có sẵn kit Raspberry luồng video trực tiếp từ camera Hệ thống nhận dạng đầy đủ bảy loại cảm xúc, tốc độ xử lý nhanh Tuy nhiên hệ thống vài hạn chế việc nhận dạng cảm xúc xảy nhầm lẫn cảm xúc biểu cảm khuôn mặt không rõ ràng Nguồn đầu vào bị nhiễu yếu tố bên thiếu ánh sáng cường độ sáng cao dẫn đến việc nhận dạng sai cảm xúc Thêm vào đó, thay đổi góc cạnh lớn khuôn mặt yếu tố khiến hệ thống nhận dạng khuôn mặt 5.2 Hướng phát triển Cá nhân thực đề tài đưa số hướng phát triển sau để đề tài hoàn thiện hơn: 82 Kết hợp hai hệ thống nhận diện khuôn mặt cảm xúc thành vừa nhận diện khuôn mặt , vừa nhận diện cảm xúc đối tượng từ luồng video trực tuyến thơng qua camera Tăng độ xác hai hệ thống thuật toán Deep Learning triển khai đến mơ hình mạng học sâu tiên tiến để hai hệ thống nhận diện có xác tốt Xây dựng phát triển mô hình phần cứng tốt với tốc độ xử lý nhanh ổn định mà hệ thống phải tính tốn phức tạp với mơ hình mạng nơ-ron tích chập Đối với hệ thống nhận diện khn mặt, thêm nhiều người vào tập liệu tự tạo nhằm đa dạng hóa liệu tăng số lượng lượng người mà hệ thống cần nhận dạng Số lượng tập mẫu người lớn hệ thống nhận diện có độ xác tốt Bên cạnh đó, phát triển hệ thống nhận diện khn mặt ứng dụng thực tế điểm danh nhân viên lĩnh vực an ninh Ngoài việc triển khai áp dụng thực tế gặp nhiều thách thức thông số môi trường cường độ ánh sáng đầu vào, cảm xúc biểu cảm khuôn mặt, chất lượng ảnh đầu vào, chất lượng phần cứng camera, vi xử lý, thuật toán xử lý, đồng với máy chủ, đám mây.… Đối với hệ thống nhận diện cảm xúc,tìm kiếm thêm nhiều tập liệu mẫu có số lượng ảnh chứa cảm xúc tự nhiên khuôn mặt lớn, nhiều biểu cảm phức tạp chất lượng để huấn luyện để đạt kết tốt hơn, độ xác cao Bên cạnh nghiên cứu phát triển thêm thuật tốn tối ưu mơ hình mạng nơ-ron tích chập nhiều lớp sâu để đáp ứng nhận dạng cảm xúc nhiều người lúc 83 TÀI LIỆU THAM KHẢO [1] Dan Duncan, Gautam Shine, Chris English (2016) , “ Facial Emotion Recognition in real time ” Stanford University [2] Competition “ Challenges in Representation Learning: Facial Expression Recognition Challenge ”, https://www.kaggle.com/c/challenges-in-representationlearning-facial-expression-recognition-challenge/, [ngày truy cập 15/04/2020 ] [3] N Dalai, B Triggs (2005), “Histograms of Oriented Gradients for Human Detection” IEEE Computer Society Conference on Computer Vision and Pattern Recognition [4] Hiyam Hatem, Zou Beiji.Raed Majeed (2015), “A Survey of Feature Base Methods for Human Face Detection”, International Journal of Control and Automation Vol.8, No.5 (2015), pp.61-78 [5] Hwai-Jung Hsu and Kuan-Ta Chen (2015) “Face recognition on drones: Issues and limitations” In Proceedings of the First Workshop on Micro Aerial Vehicle Networks, Systems, and Applications for Civilian Use, DroNct ’15, pages 39-44, New York, NY, USA, 2015 ACM [6] Rabia Jafri and Hamid R Arabnia (2009) “A survey of face recognition techniques” JIPS, 5(2),pp.41- 68 [7] Alex Krizhevsky, Ilya Sutskever and Geoffrey E Hinton (Aug.2010), “ ImageNet Classification with Deep Convolutional Neural Networks ”, University of Toronto [8] Keiron O’Shea and Ryan Nash (Dec.2015) , “An Introduction to Convolutional Neural Networks”, Aberystwyth University 84 [9] Rok Novosel, Blaz Meden, Ziga Emer, Vitomir Struc, Peter Peer (2017) “Face recognition with Raspberry Pi for IoT Environments” Faculty of Computer and Information Science Faculty of Electrical Engineering University of Ljubljana [10] O Nikisins, R Fuksis, A Kadikis, and M Greitans (2015) , “Face recognition system on raspberry pi,” Proc Of ICIPCE, vol 15 [11] Lương Mạnh Bá, Nguyễn Thanh Thủy (2006), “Nhập môn xử lý ảnh số”.Nhà xuất khoa học kỹ thuật, Hà Nội, Việt Nam [12] Nitish Srivastava, Geoffrey Hinton, Alex Krizhevsky , Ilya Sutskever, Ruslan Salakhutdinov (2014), “ Dropout: A Simple Way to Prevent Neural Networks from Overfitting ” , Department of Computer Science, University of Toronto Canada , pp 1932-1954 [13] N Kwak (Jan.2016), “Introduction to Convolutional Neural Networks ( CNNs)” Department of Transdisciplinary Studies Seoul National University, Korea [14] R E Turner (2014) , “Lecture 14 : Convolutional neural networks for computer vision” University of Cambride [16] Richard F.Lyon, (2006), “A Brief History of ‘Pixel’ ” Foveon Inc , 2820 San Tomas Expressway, Santa Clara CA 95051 [17] Robin Milner, Mads Tofte, Robert Harper “The Definition of Standard ML”, Lab oratory for Foundations of Computer Science Department of Computer Science University of Edinburgh [18] Florian Schroff, Dmitrv Kalcnichenko, and James Philbin (2015) “Facenet: A unified embedding for face recognition and clustering In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition”, pages 815-823 85 [19] Yash Srivastava, Vaishnav Murali, and Shiv Ram Dubey (2019) “A Performance Comparison of LoNetss Functions for Deep Face Recognition” Computer Vision Group, Indian Institute of Information Technology, Sri City, India, pages – 10 [20] Ashutosh ChandraBhensle, Rohit Raja (2014) “An Efficient Face Recognition using PCA and Euclidean Distance Classification, Computer Science and Engineering Department, CSVTU, Bhilai FET, SSGI, Bhilai, India” [21] Patrick Lucey cộng (Aug.2010) , “The Extended Cohn-Kanade Dataset (CK+): A complete dataset for action unitand emotion-specified expression”, in 2010 IEEE Computer Society Conference on Computer Vision and Pattern Recognition – Workshops, San Francisco, CA, USA [22] Bộ sở liệu LFW, http://vis-www.cs.umass.edu/lfw/ [Ngày truy cập 25/04/2020] [23] Thư viện Dlib, http://dlib.net/ [Ngày truy cập 25/04/2020] [24] Thư viện Opencv, http://opencv.org/ [Ngày truy cập 27/04/2020] [25] Kaiming He, Xiangyu Zhang, Shaoqing Ren, (2015), “Deep Residual Learning for Image Recognition ” , Microsoft coporation, pages 770-778 86 ... tài “ Xây dựng hệ thống nhận diện khuôn mặt cảm xúc dùng mạng nơ- ron tích chập ” xây dựng với hai mục đích nhận diện khn mặt nhận diện cảm xúc Đối với hệ thống nhận diện khuôn mặt, cá nhận thực... HỆ THỐNG NHẬN DIỆN KHUÔN MẶT VÀ CẢM XÚC DÙNG MẠNG NƠ -RON TÍCH CHẬP TRÊN KIT RASPBERRY PI 3.1 Yêu cầu hệ thống Đối với hệ thống nhận dạng khn mặt cảm xúc, ngồi yêu cầu chung hệ thống nhận dạng... 28 CHƯƠNG : XÂY DỰNG HỆ THỐNG NHẬN DIỆN KHUÔN MẶT VÀ CẢM XÚC DÙNG MẠNG NƠ -RON TÍCH CHẬP TRÊN KIT RASPBERRY PI 33 3.1 Yêu cầu hệ thống 33 x 3.2 Đặc tả hệ thống