1. Trang chủ
  2. » Luận Văn - Báo Cáo

Dự đoán tuổi và giới tính bằng phương pháp học sâu

77 3 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 77
Dung lượng 2,69 MB

Nội dung

Dự đoán tuổi và giới tính bằng phương pháp học sâu.Dự đoán tuổi và giới tính bằng phương pháp học sâu.Dự đoán tuổi và giới tính bằng phương pháp học sâu.Dự đoán tuổi và giới tính bằng phương pháp học sâu.Dự đoán tuổi và giới tính bằng phương pháp học sâu.Dự đoán tuổi và giới tính bằng phương pháp học sâu.Dự đoán tuổi và giới tính bằng phương pháp học sâu.Dự đoán tuổi và giới tính bằng phương pháp học sâu.Dự đoán tuổi và giới tính bằng phương pháp học sâu.Dự đoán tuổi và giới tính bằng phương pháp học sâu.Dự đoán tuổi và giới tính bằng phương pháp học sâu.Dự đoán tuổi và giới tính bằng phương pháp học sâu.Dự đoán tuổi và giới tính bằng phương pháp học sâu.Dự đoán tuổi và giới tính bằng phương pháp học sâu.Dự đoán tuổi và giới tính bằng phương pháp học sâu.Dự đoán tuổi và giới tính bằng phương pháp học sâu.Dự đoán tuổi và giới tính bằng phương pháp học sâu.Dự đoán tuổi và giới tính bằng phương pháp học sâu.Dự đoán tuổi và giới tính bằng phương pháp học sâu.Dự đoán tuổi và giới tính bằng phương pháp học sâu.Dự đoán tuổi và giới tính bằng phương pháp học sâu.Dự đoán tuổi và giới tính bằng phương pháp học sâu.Dự đoán tuổi và giới tính bằng phương pháp học sâu.Dự đoán tuổi và giới tính bằng phương pháp học sâu.

i HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG - TRẦN TẤN LỘC DỰ ĐỐN TUỔI VÀ GIỚI TÍNH BẰNG PHƯƠNG PHÁP HỌC SÂU ĐỀ ÁN TỐT NGHIỆP THẠC SĨ KỸ THUẬT (Theo định hướng ứng dụng) THÀNH PHỐ HỒ CHÍ MINH – NĂM 2023 ii HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THÔNG TRẦN TẤN LỘC DỰ ĐỐN TUỔI VÀ GIỚI TÍNH BẰNG PHƯƠNG PHÁP HỌC SÂU Chuyên ngành: Hệ thống thông tin Mã số: 8.48.01.04 ĐỀ ÁN TỐT NGHIỆP THẠC SỸ KỸ THUẬT (Theo định hướng ứng dụng) NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS LÊ HỒNG THÁI THÀNH PHỐ HỒ CHÍ MINH – NĂM 2023 i LỜI CAM ĐOAN Tôi xin cam đoan đề án thạc sĩ công nghệ thông tin “Dự đốn tuổi giới tính phương pháp học sâu” nghiên cứu, tổng hợp thực Tất nội dung, số liệu, kết nêu đề án tốt nghiệp trung thực chưa công bố cơng trình khác Tơi hồn tồn chịu trách nhiệm cho hành vi chép trái phép vi phạm quy chế đào tạo Tp Hồ Chí Minh, ngày 16 tháng 08 năm 2023 Học viên thực đề án Trần Tấn Lộc ii LỜI CẢM ƠN Tôi xin gửi lời cảm ơn chân thành sâu sắc đến PGS.TS Lê Hoàng Thái, người thầy tận tâm nhiệt tình việc hướng dẫn động viên tơi suốt q trình thực đề án Nhờ hỗ trợ người thầy, định hướng hồn thành mục tiêu mà tơi đề Tôi xin gửi lời tri ân chân thành đến Thầy, Cơ đồng hành tận tình giảng dạy cho suốt thời gian học tập chương trình Thạc sĩ Hệ thống thơng tin khoa Đào tạo Sau đại học, Học viện Cơng nghệ Bưu Viễn thơng sở thành phố Hồ Chí Minh Tơi muốn bày tỏ lịng biết ơn đến ban Giám Đốc Trung tâm Công nghệ Thông tin – Viễn thông Tây Ninh tạo điều kiện thuận lợi cho học tập Tôi biết ơn đến tất bạn bè động viên, hỗ trợ đóng góp ý kiến quý báu cho đề án Đóng góp bạn giúp tơi hồn thiện nghiên cứu Đề án hoàn thành đạt số kết định, thừa nhận cịn tồn hạn chế thiếu sót Vì vậy, tơi chân thành mong nhận thơng cảm đóng góp quý báu từ quý thầy bạn để tơi cải thiện nâng cao chất lượng nghiên cứu Một lần xin chân thành cảm ơn! Tp Hồ Chí Minh, ngày 16 tháng 08 năm 2023 Học viên thực đề án Trần Tấn Lộc iii MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii MỤC LỤC iii DANH MỤC CÁC THUẬT NGỮ, CHỮ VIẾT TẮT vi DANH SÁCH BẢNG vii DANH SÁCH HÌNH VẼ viii MỞ ĐẦU CHƯƠNG - TỔNG QUAN 1.1 Lý chọn đề án 1.2 Tổng quan vấn đề nghiên cứu 1.3 Mục tiêu nghiên cứu 1.4 Đối tượng phạm vi nghiên cứu 1.5 Phương pháp nghiên cứu 1.6 Ý nghĩa khoa học thực tiễn đề án 10 CHƯƠNG - CƠ SỞ LÝ THUYẾT 11 2.1 Giới thiệu học sâu thị giác máy tính 11 2.1.1 Học sâu 11 2.1.1.1 Các thành phần mơ hình học sâu 12 2.1.1.2 So với máy học, mơ hình học sâu mang lại lợi ích sau 13 2.1.2 Thị giác máy tính 15 iv 2.2 Kiến trúc mạng nơ ron tích chập 15 2.2.1 Tổng quan kiến trúc mạng tích chập 15 2.2.2 Các đặc trưng chung mạng CNN 17 2.2.3 Các mạng CNN tiêu biểu 19 CHƯƠNG - PHÂN TÍCH VÀ THIẾT KẾ HỆ THỐNG 27 3.1 Hướng tiếp cận 27 3.2 Dữ liệu huấn luyện 27 3.2.1 Giới thiệu tập liệu 27 3.2.2 Các bước xây dựng từ tập liệu Adience Dataset 29 3.3 Tiền xử lý liệu 31 3.3.1 Loại bỏ đặc trưng không cần thiết 31 3.3.2 Chỉnh kích thước ảnh sang kích thước phù hợp 32 3.4 Mơ hình sử dụng 32 3.4.1 Tổng quan mơ hình 32 3.4.2 Định nghĩa 35 3.4.3.Chuẩn bị liệu tập huấn 38 3.4.4 Kiến trúc 40 3.4.5 Huấn luyện mơ hình 43 3.4.5.1 Khởi tạo mơ hình 43 3.4.5.2 Các phương thức tiền xử lý ảnh 45 3.4.5.3 Các bước tiến hành huấn luyện mơ hình 48 v CHƯƠNG - CÀI ĐẶT THỬ NGHIỆM VÀ ĐÁNH GIÁ 52 4.1 Cài đặt môi trường 52 4.2 Phương pháp đánh giá 52 4.3 Phân tích đánh giá hệ thống đề xuất 53 4.3.1 Xây dựng mô đun đánh giá 53 4.3.2 Kiểm tra đánh giá hệ thống liệu công khai 57 4.3.2.1 Bộ liệu công khai Adience 57 4.3.2.2 Kết đánh giá liệu công khai Adience 57 4.3.3 Kiểm tra đánh giá hệ thống liệu xây dựng 59 4.3.3.1 Bộ liệu xây dựng 59 4.3.3.2 Kết đánh giá liệu xây dựng 59 4.4 Cài đặt triển khai thử nghiệm 60 KẾT LUẬN 64 DANH MỤC TÀI LIỆU THAM KHẢO 66 vi DANH MỤC CÁC THUẬT NGỮ, CHỮ VIẾT TẮT VIẾT TẮT TIẾNG ANH TIẾNG VIỆT CNN Convolutional Neural Network Mạng Nơ ron tích chập CV Curriculum Vitae Hồ sơ cá nhân AI Artificial Intelligence Trí tuệ nhân tạo DL Deep Learning Học sâu ML Mechine Learning Học máy Conv Convolutional layer Lớp tích chập ReLU Rectified Linear Unit Hàm kích hoạt mạng nơ ron nhân tạo vii DANH SÁCH BẢNG Bảng 3.1: Danh mục nhãn 30 Bảng 3.3: Thông tin nhãn tương ứng với ảnh 31 viii DANH SÁCH HÌNH VẼ Hình 2.1: Mơ hình học sâu 12 Hình 2.2: Hình ảnh tỷ lệ xám có kênh 17 Hình 2.3: Mạng Alexnet, kiến trúc điển hình CNN 17 Hình 2.4: Kiến trúc LeNet 19 Hình 2.5: Kiến trúc AlexNet 19 Hình 2.6: Hàm ReLU 21 Hình 2.7: Phương pháp dropout 21 Hình 2.8: Kiến trúc VGG-16 22 Hình 2.9: Kiến trúc GoogleNet 23 Hình 2.10: Kiến trúc GoogleNet - Inception version 25 Hình 3.1: Hình ảnh tập liệu Adience 28 Hình 3.2: Thư mục chứa ảnh giải nén 29 Hình 3.3: Mạng Alexnet 33 Hình 3.4: Ví dụ thí nghiệm sử dụng ReLU 35 Hình 3.5: Tổ chức thư mục 36 Hình 3.6: Mơ hình gồm block 40 Hình 3.7: Kết huấn luyện độ tuổi dạng biểu đồ 49 Hình 3.8: Kết huấn luyện độ tuổi 50 Hình 3.9: Kết huấn luyện giới tính dạng biểu đồ 51 Hình 3.10: Kết huấn luyện giới tính 51 52 CHƯƠNG - CÀI ĐẶT THỬ NGHIỆM VÀ ĐÁNH GIÁ 4.1 Cài đặt mơi trường Trong q trình triển khai xây dựng mơ hình cho đề án này, tơi áp dụng giải pháp phần mềm sau Ngơn ngữ lập trình Python Trong lĩnh vực học máy học sâu, Python ngơn ngữ lập trình phổ biến sử dụng cho nghiên cứu phát triển Python cung cấp nhiều thư viện hỗ trợ mạnh mẽ cho tính tốn số học, xử lý liệu, xử lý hình ảnh cho phép dễ dàng triển khai thuật tốn xây dựng mơ hình học máy Trong đề án này, sử dụng ngôn ngữ lập trình Python với phiên cụ thể Python 3.8.10 Môi trường cài đặt - Trên môi trường Google Colab - Máy tính hệ điều hành Windows 10 - CPU Intel core i5 6200U 2.3GHz - RAM GB - SSD 480 GB 4.2 Phương pháp đánh giá Để đánh giá hiệu suất toán dự đoán tuổi giới tính phương pháp học sâu tơi sử dụng độ đo như: Accuracy, Precision, Recall Accuracy: hay cịn gọi độ xác, đo lường khả mơ hình việc phân loại liệu cách xác, tức xác định nhãn lớp tương ứng cho mẫu liệu Độ xác thường tính cơng thức sau: 53 Accuracy = TP + TN (TP + TN) + (FP + FN) Precision: Được định nghĩa xác suất mà dự đoán phân loại biết phân loại dự đốn thuộc lớp Precision tính cách chia số lượng mẫu phân loại xác thuộc lớp cho tổng số mẫu phân loại thuộc lớp Cơng thức ước lượng precision sau: Precision = TP TP + FP Recall: hay gọi độ phủ, xác suất mà mẫu có nhãn phân loại Recall tính cách chia số lượng mẫu phân loại thuộc lớp cho tổng số mẫu thực tế thuộc lớp Cơng thức ước lượng recall sau: Recall = TP TP + FN 4.3 Phân tích đánh giá hệ thống đề xuất 4.3.1 Xây dựng mô đun đánh giá Mơ đun thực tải hình ảnh có chứa khn mặt người cần dự đốn Dữ liệu đầu vào ảnh chứa liệu khuôn mặt tên ảnh phải dán nhãn ví dụ: 0_15 - Với đại diện cho giới tính nữ (0 giới tính nữ, giới tính nam) - Sau ký tự ‘_’ độ tuổi xác, ví dụ: _15 15 tuổi Sau có liệu đầu vào, tiến hành thực đánh sau: 54 Hình 4.1: Giao diện tải ảnh lên hệ thống đánh giá Sau tải hình ảnh chuẩn bị vào hệ thống, hệ thống hiển thị giao diện sau: Hình 4.2: Giao diện tải hình Chọn nút “Dự đoán” hệ thống tiến hành thực dự đốn hình ảnh đầu vào cho kết với thông tin sau: - Thông tin độ tuổi thực tế - Thơng tin giới tính thực tế - Thơng tin độ tuổi dự đốn - Thơng tin giới tính dự đốn - Kết dự đốn 55 Hình 4.3: Kết dự đốn giới tính nam độ tuổi 12 Hình 4.4: Kết dự đốn giới tính nam độ tuổi 45 56 Hình 4.5: Kết dự đốn giới tính nữ độ tuổi 40 Hình 4.6: Kết dự đốn giới tính nữ độ tuổi 18 57 Hình 4.7: Kết dự đốn giới tính nam độ tuổi 28 4.3.2 Kiểm tra đánh giá hệ thống liệu công khai 4.3.2.1 Bộ liệu công khai Adience Tôi phân chia liệu thành hai tập, gồm tập huấn luyện tập kiểm tra, để sử dụng trình đánh giá kiểm tra hiệu suất mơ hình Tổng số ghi liệu 26.580 Tập huấn luyện bao gồm 26.000 ghi, tương đương với 97.8% tổng số ghi Tập kiểm tra có 580 ghi, tương đương với 2.2% tổng số ghi 4.3.2.2 Kết đánh giá liệu công khai Adience Dựa kết từ trình huấn luyện, tiến hành kiểm chứng mơ hình huấn luyện tập liệu kiểm tra Kết kiểm chứng ghi nhận sau: Dự đốn giới tính: 58 Dựa kết kiểm chứng, mơ hình dự đốn giới tính liệu cơng khai Adience đạt độ xác phân loại mức tương đương 86.6666666667% Tiếp theo, xem xét độ đo khác Precision Recall, F1-Scrore từ kết sau đây: Hình 4.8: Kết kiểm chứng mơ hình với dự đốn giới tính với liệu cơng khai Dự đốn tuổi: Dựa kết kiểm chứng, mơ hình dự đốn độ tuổi liệu cơng khai Adience đạt độ xác phân loại mức tương đương 92.3076923077% Tiếp theo, xem xét độ đo khác Precision Recall, F1-Scrore từ kết sau đây: Hình 4.9: Kết kiểm chứng mơ hình với dự đốn tuổi với liệu cơng khai 59 4.3.3 Kiểm tra đánh giá hệ thống liệu xây dựng 4.3.3.1 Bộ liệu xây dựng Tôi thực thu thập liệu chứa hình khn mặt người thơng tin độ tuổi giới tính cách xác thơng qua việc khảo sát đồng nghiệp làm việc VNPT Tây Ninh Bộ liệu gồm 30 ảnh khuôn mặt thông tin xác độ tuổi giới tính người 4.3.3.2 Kết đánh giá liệu xây dựng Từ kết trình huấn luyện, tơi thực kiểm chứng mơ hình huấn luyện tập liệu xây dựng Dưới kết thu được: Dự đốn giới tính: Từ kết kiểm chứng với số đánh giá độ xác phân lớp mơ hình dự đốn giới tính liệu xây dựng nhận mức tương đương 89.6551724138% Tôi xem xét với độ đo khác Precision Recall, F1-Scrore từ kết đây: Hình 4.10: Kết kiểm chứng mơ hình dự đốn giới tính với liệu xây dựng Dự đốn tuổi: 60 Từ kết kiểm chứng với số đánh giá, tơi nhận độ xác phân loại mơ hình dự đốn độ tuổi liệu xây dựng mức tương đương 90.00% Dưới độ đo khác Precision Recall, F1-Scrore từ kết thu được: Hình 4.11: Kết kiểm chứng mơ hình với dự đốn tuổi với liệu xây dựng 4.4 Cài đặt triển khai thử nghiệm Hệ thống áp dụng kết đạt trình dự đốn độ tuổi giới tính vào ứng dụng hỗ trợ công tác tuyển dụng Sau truy cập, hệ thống hiển thị hình sau: Hình 4.12: Giao diện hệ thống 61 Nhà tuyển dụng thực nhập thông tin ứng viên nhập CV ứng tuyển với thông tin: - Họ tên ứng viên tự khai (bắt buộc phải ký tự chữ) - Năm sinh ứng viên tự khai (bắt buộc, thuộc ký tự số không lớn năm tại) - Giới tính ứng viên tự khai (bắt buộc) Hình 4.13: Giao diện nhập thơng tin ứng viên Sau nhà tuyển dụng thực chọn ảnh ứng viên vị trí sau: Hình 4.14: Giao diện chọn ảnh ứng viên Sau thực đầy đủ thông tin ứng viên theo yêu cầu Nhà tuyển dụng chọn nút “Dự đốn” góc bên phải hình 62 Hình 4.15: Giao diện nhập xong thông tin Sau thực thực dự đốn hình ảnh liệu nhà tuyển dụng nhập vào hệ thống tiến hành xử lý trả kết dự đoán với trường hợp sau: Không đủ tuổi lao động - Cần phải xem xét lại: Hình 4.16: Giao diện kết nghi vấn độ tuổi lao động 63 Trong độ tuổi lao động: Hình 4.17: Giao diện kết độ tuổi lao động Nghi vấn tuổi lao động - Cần phải xem xét lại: Hình 4.18: Giao diện kết nghi vấn độ tuổi lao động 64 KẾT LUẬN Trong nghiên cứu này, giới thiệu mơ hình học sâu sử dụng mạng CNN để nhận dạng độ tuổi giới tính người dựa hình ảnh khn mặt Mơ hình cho phép sử dụng số lượng nhỏ tham số đạt hiệu suất dự đốn giới tính với 86.6667 % liệu công khai Adience 89.6551% với liệu thu thập, dự đốn độ tuổi 92.3077% liệu cơng khai Adience 90.000% với liệu thu thập Trong tương lai gần, tơi có kế hoạch để nâng cao độ xác mơ hình, đặc biệt việc ước lượng độ tuổi giới tính Ngồi ra, tơi áp dụng mơ hình cho toán hỗ trợ tuyển dụng cách rộng rãi, nhanh chống xác Những kết hoạt động đề án Trong nghiên cứu này, tơi tìm hiểu áp dụng phương pháp học sâu để dự đốn độ tuổi giới tính Mục tiêu áp dụng kỹ thuật để giải tốn hỗ trợ cơng tác tuyển dụng thơng qua việc dự đốn độ tuổi giới tính ứng viên Tiếp theo, tơi tiến hành tìm hiểu nghiên cứu mơ hình mạng nơ ron tích chập, mơ hình phổ biến lĩnh vực học sâu Tôi khám phá thành phần, kiến trúc mơ hình chức mạng nơ ron tích chập, ứng dụng thực tế Sau đó, tơi xây dựng mơ hình mạng nơ ron tích chập để dự đốn độ tuổi giới tính người dựa hình ảnh Q trình bao gồm việc huấn luyện mơ hình, điều chỉnh tham số áp dụng kỹ thuật để đạt độ xác cao việc dự đốn độ tuổi giới tính Tuy nhiên, đề án số vấn đề tiếp tục phát triển 65 Về ứng dụng Xây dựng ứng dụng web hỗ trợ công tác tuyển dụng Hạn chế đề án Vẫn cịn hạn chế độ xác hình ảnh gặp trường hợp phức tạp, đặc biệt đối tượng hình ảnh không tuân thủ theo đặc điểm phổ biến độ tuổi giới tính, ví dụ: nữ để tóc ngắn Đề án dừng mức xây dựng mơ hình dự đốn tuổi giới tính hỗ trợ công tác tuyển dụng mặt độ tuổi giới tính, chưa hỗ trợ chuyên sâu phân tích đánh giá vị trí cơng việc Đề án khơng tránh khỏi sai sót báo cáo này, kính mong thông cảm quý Thầy Cô Nhà khoa học số hạn chế thời gian, kinh nghiệm ngôn ngữ Định hướng phát triển Hướng nghiên cứu đề án tập trung vào phần xây dựng mơ hình mạng phân loại độ tuổi giới tính với độ xác cao hơn, sử dụng mơ hình áp dụng nhiều tầng tích chập, phân tích đặc trưng chi tiết Dự đoán lúc nhiều người cho kết xác kể trường hợp đặt biệt hình dạng 66 DANH MỤC TÀI LIỆU THAM KHẢO Tiếng Việt [1] Phạm Thị Út Hạnh, “Công tác tuyển dụng nhân lực công ty cổ phần nhiệt điện Phả Lại” [2] Ma Thị Hồng Thu, Phùng Thị Thu Trang, “Một mơ hình Deep Learning nhẹ cho tốn nhận dạng tuổi giới tính sử dụng mạng CNN” [3] Theo quy định “Khoản Điều Bộ luật lao động năm 2012” Tiếng Anh [4] A Krizhevsky, I Sutskever, and G E Hinton (2012), “Imagenet classification with deep convolutional neural networks” [5] L Zhu, K Wang, L Lin, and L Zhang (2016), “Learning a lightweight deep convolutional network for joint age and gender recognition” [6] E Eidinger, R Enbar, and T Hassner (2014), “Age and gender estimation of unfiltered faces” [7] G Levi and T Hassner (2015), “Age and gender classification using convolutional neural networks” [8] N Ramanathan and R Chellappa (2006), “Modeling age progression in young faces” [9] I Ullah, M Hussain, G Muhammad, H Aboalsamh, G Bebis, and A M Mirza (2012), “Gender recognition from face images with local wld descriptor” [10] X Zhuang, X Zhou, M Hasegawa-Johnson, and T Huang (2008), “Face age estimation using patch-based hidden markov model supervectors”

Ngày đăng: 25/08/2023, 22:15

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w