1. Trang chủ
  2. » Giáo Dục - Đào Tạo

(Tiểu luận) dđề tài nhận diện giới tính thông qua avartar mạng xã hội

38 9 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

Trong số các thông tin được khai thác thì giới tính là một thuộc tính quan trọng vì nó có khá nhiều ứng dụng trong thực tế như thống kê dân số, xác định giới tính để phân loại khách hàng

HỌC VIỆN NGÂN HÀNG KHOA HỆ THỐNG THÔNG TIN QUẢN LÝ MƠN HỌC: TRÍ TUỆ NHÂN TẠO TRONG KINH DOANH (IS42A) ĐỀ TÀI: NHẬN DIỆN GIỚI TÍNH THƠNG QUA AVATAR MẠNG XÃ HỘI Giảng viên hướng dẫn : Cô Bùi Thị Hồng Nhung Sinh viên thực : Nhóm 04 Nhóm lớp : IS42A18 Cán chấm thi Điểm Hà Nội, ngày 04 tháng 01 năm 2023 DANH SÁCH THÀNH VIÊN NHÓM 04 STT HỌ TÊN MSV Dung 23A4050084 (Nhóm trưởng) Phạm Thị Thu Phương % ĐĨNG GÓP - Viết báo cáo phần 5.2 (Ý Nguyễn Thùy CÔNG VIỆC nghĩa thực tiễn) - Tổng hợp, chỉnh sửa 20% - Design report - Viết báo cáo phần (Mã 23A4010529 lệnh chương trình) 20% - Edit video - Viết báo cáo phần (Mã Phạm Thị Như 23A4070146 lệnh chương trình) phần 5.1 (Nhận định) 20% - Edit video Nguyễn Thị Bích Thủy Nguyễn Thị Hường - Viết báo cáo phần 23A4020377 (Chuẩn bị liệu) phần 20% (Giới thiệu CNN) - Viết báo cáo phần (Giới 23A4020469 thiệu chung) phần 20% (Chuẩn bị liệu) Việc tìm liệu chạy mơ hình phân cơng cho tất thành viên nhóm MỤC LỤC Trang NỘI DUNG 1 Giới thiệu chung 1.1 Giới thiệu chung mạng xã hội hoạt động quảng cáo 1.1.1 Facebook 1.1.2 Instagram 1.1.3 TikTok 1.2 Phát biểu tốn nhận dạng giới tính 1.3 Lý chọn đề tài Chuẩn bị liệu 2.1 Cách thức thu nhập liệu 2.2 Kiểu liệu ảnh cần thu nhập 2.3 Số lượng ảnh kiểu liệu ảnh 2.4 Cách thức tổ chức liệu ảnh máy Giới thiệu tổng quan thuật toán CNN 3.1 Đặc trưng 3.2 Cấu trúc 3.3 Tích chập Mã lệnh chương trình 4.1 Tạo thư mục dự án Bước 1: Tạo thư mục dự án Bước 2: Upload tập liệu ảnh Bước 3: Tạo file Colab notebook Google Drive 4.2 Đọc liệu tiền xử lý ảnh Bước 1: Khai báo thư viện sử dụng Bước 2: Kết nối với Google Drive để đọc, lưu liệu khai báo để Huấn luyện Kiểm định mô hình Bước 3: Khai báo đường dẫn thư mục chứa liệu ảnh 11 Bước 4: Gán nhãn cho liệu ảnh 11 Bước 5: Tiền xử lý liệu ảnh với ImageDataGenerator 11 Bước 6: Đọc liệu train validation 12 4.3 Xây dựng mơ hình 12 4.3.1 Tầng CNN1 13 4.3.2 Tầng CNN2 13 4.3.3 Flatten 14 4.3.4 Lớp ẩn Dense 15 4.3.5 Lớp output 15 4.4 Thiết lập tham số để huấn luyện mơ hình 16 4.5 Huấn luyện mơ hình 17 4.6 Tìm mơ hình tối ưu 20 4.6.1 Thay đổi kích thước ảnh 21 4.6.2 Tăng lớp CNN mô hình 21 4.6.3 Thay đổi lọc lớp CNN 22 4.6.4 Thay đổi kích thước lọc convolutional lớp CNN 22 4.6.5 Tăng thêm lớp ẩn 23 4.6.6 Thay đổi lọc lớp ẩn 24 4.6.7 Thay đổi tham số optimizer 24 4.7 Sử dụng mơ hình 25 Kết luận 27 5.1 Nhận định 27 5.2 Ý nghĩa thực tế 29 DANH MỤC TÀI LIỆU THAM KHẢO NỘI DUNG Giới thiệu chung 1.1 Giới thiệu chung mạng xã hội hoạt động quảng cáo 1.1.1 Facebook Facebook mạng xã hội giúp cho kết nối với qua tài khoản ảo Trên Facebook đăng trạng thái, hình ảnh, video chia sẻ tất mà người dùng muốn Khơng vậy, cịn kết bạn với người dùng khác từ khắp nơi giới tương tác với họ qua tương tác (reaction) bình luận (comment) Facebook sáng lập Mark Zuckerberg vào năm 2004 trường Đại học Harvard với số lượng người dùng ỏi Vào cuối năm 2012, mạng xã hội Facebook đạt tỷ người sử dụng trở thành mạng xã hội lớn giới thời điểm Ngày nay, Facebook chiếm vị trí dẫn đầu lượng người dùng phổ biến tồn giới Đặc biệt, Facebook cịn nơi doanh nghiệp người bán hàng online quảng bá sản phẩm thơng báo chương trình khuyến doanh nghiệp Facebook Ads viết tắt cụm từ Facebook Advertising, phương thức quảng cáo sử dụng phương tiện Facebook Facebook kiếm phần lớn doanh thu từ quảng cáo Quảng cáo hiển thị phân phối cách tự động tùy vào đặc điểm cá nhân người dùng nhân học, vị trí địa lý, sở thích… 1.1.2 Instagram Instagram tảng truyền thơng xã hội nơi người dùng tải lên chia sẻ hình ảnh video từ thiết bị di động Vào năm 2010, Instagram trở thành mạng xã hội phát triển Đến năm 2012, mạng xã hội Facebook mua lại Chính nhờ sáp nhập mà Instagram đạt số tăng trưởng kỷ lục Chỉ sau năm sáp nhập với Facebook, mạng xã hội Instagram đạt tới số 150 triệu người dùng tháng Tại Việt Nam dù cá nhân, doanh nghiệp hay làm điều số lượng người sử dụng ngày nhiều Ngồi Instagram cịn có số điểm bật Facebook cập nhật hiệu ứng ảnh phù hợp với thời điểm để phục vụ nhu cầu sử dụng khác người dùng Nếu facebook chủ yếu sử dụng dòng trạng thái để nói lên cảm xúc, với instagram việc thể thơng qua ảnh Chính yếu tố giúp nhiều người, đặc biệt giới trẻ cảm thấy instagram trở nên thu hút Facebook Trên Instagram, người dùng thoải mái thể định hình cho phong cách Hoạt động quảng cáo instagram thực cách đơn giản Đầu tiên, doanh nghiệp chọn tệp người quan trọng với họ, sau sử dụng lựa chọn nhắm mục tiêu điều chỉnh để tiếp cận đến khách hàng Sau đó, doanh nghiệp quảng cáo viết sử dụng Trình quản lý quảng cáo cho chiến dịch đa tảng nâng cao Những hoạt động kết nối với khách hàng tăng cường định dạng quảng cáo thu hút tận dụng định dạng chọn lọc để tạo quảng cáo hấp dẫn Instagram 1.1.3 TikTok Bản chất TikTok mạng xã hội tiếng Trung Quốc, biết đến với tên gốc Douyin hay Vibrato mang ý nghĩa “rung động” Đây tảng mạng xã hội sử dụng video âm nhạc phát hành app tin tức Jinri Toutiao sáng lập năm 2016 Trung Quốc Mạng xã hội có cách thức hoạt động đơn giản trình chiếu video ngắn từ vài giây đến 15 giây Ứng dụng tạo khác biệt sức hút mạnh mẽ khả chỉnh sửa video độc đáo Cùng với kho tàng liệu âm thanh, âm nhạc vô độc đáo giúp người dùng tạo video ấn tượng Khả cá nhân hóa TikTok đánh giá cao người dùng sử dụng tính khác Nhờ TikTok dần trở nên hấp dẫn phổ biến toàn giới Hiện nay, số người dùng Tik Tok toàn cầu đạt đến số 1,6 tỷ Tik Tok đứng vị trí thứ lượt tải, thứ chi tiêu thứ số người dùng active trung bình tháng Khơng dừng lại việc giúp người dùng giải trí Tik Tok cịn giúp phát triển chiến lược truyền thông, quảng bá cho cá nhân doanh nghiệp Tik Tok Ads hay cịn gọi quảng cáo Tik Tok hình thức nhà bán hàng sử dụng mạng chia sẻ video TikTok để thực chiến dịch Marketing, quảng cáo nhằm mục đích tiếp cận đến nhiều khách hàng mục tiêu, điều hướng người xem đến link sản phẩm nhà bán Document continues below Discover more from: tích tài Phân doanh… FIN41A Học viện Ngân hàng 18 documents Go to course 23 Make sentences Anh Phân tích tài doanh… None Nhóm Tài Tiền tệ - shsajak Phân tích tài doanh… None V-BTL mơn pt2 15 24 mmm Phân tích tài doanh… None 36.PLT 09A 08 Triết học Phân tích tài doanh… None 40 PLT08A 04 Triết học Phân tích tài doanh… None 57.mại PLT10A.21 Triết hàng mong muốn Website, cửa hàng trực tuyến, trang thương điện tử bây học Tik Tok Shop doanh nghiệp để mua hàng trực tiếp 1.2 Phát biểu tốn nhận dạng giới tính 16 Phân tích tài doanh… Bài tốn: Nhận diện giới tính thơng qua avatar mạng xã hội Input: Hình ảnh khn mặt người thuộc hai lớp (loại): nam nữ Output: Kết dự đoán ảnh input thuộc lớp hai lớp Phân tích trích xuất thơng tin khuôn mặt nhà khoa học nghiên cứu từ năm 90 kỷ trước phân tích ảnh khn mặt đem lại nhiều thơng tin bổ ích danh tính, cảm xúc, giới tính Trong số thơng tin khai thác giới tính thuộc tính quan trọng có nhiều ứng dụng thực tế thống kê dân số, xác định giới tính để phân loại khách hàng… Tuy nhiên, trình độ đọc hiểu thông tin ảnh, hoạt động hiệu với nhóm người định gặp khó khăn nhận dạng người cộng đồng LGBT, người chuyển giới Hay người độ tuổi khác có đặc điểm nhận dạng khác nhau, hay khác biệt rõ rệt người châu Á, châu Âu, người lãnh thổ khác nhau; Để có hình ảnh đối chiếu, cơng nghệ nhận dạng khn mặt yêu cầu khách hàng phải quay rõ mặt phía camera khơng sử dụng trang, mũ, nón làm giảm trải nghiệm khách hàng Mặc dù q trình nghiên cứu ứng dụng gặp nhiều khó khăn nhận dạng giới tính đóng vai trị quan trọng dạng toán nhận dạng phân lớp Là sở để phát triển thuật toán khác, đóng góp vai trị quan trọng cơng nghiên cứu người hành vi họ 1.3 Lý chọn đề tài Trong vài năm qua, mạng xã hội trở nên phổ biến vào sống hàng ngày hầu hết người Việt Nam với tỷ lệ sử dụng điện thoại thông minh internet ngày tăng Việt Nam Nhờ có dân số trẻ, hiểu biết kỹ thuật số có tính kết nối cao, Việt Nam nằm số quốc gia có số lượng người dùng mạng xã hội cao toàn giới Kể từ xuất hiện, việc sử dụng mạng mở rộng từ việc giữ liên lạc với bạn bè gia đình trở thành cơng cụ mạnh mẽ thương hiệu sử dụng để tiếp cận người tiêu dùng họ nước quốc tế Theo thống kê vào năm 2021 None lượng người dùng Facebook Việt Nam lên tới khoảng 65,56 triệu người Số lượng người dùng Facebook Việt Nam dự kiến tăng lên 63,90 triệu người dùng vào năm 2025; lượng người dùng Instagram Việt Nam đạt khoảng 7,98 triệu người Số lượng người dùng Instagram Việt Nam dự kiến tăng lên 10,93 triệu người dùng vào năm 2025; lượng người dùng TikTok Việt Nam lên tới khoảng 16,69 triệu người Số lượng người dùng Tik Tok Việt Nam dự kiến tăng lên 17,42 triệu người dùng vào năm 2025 Ngoài chức ban đầu kết nối người, mạng xã hội xem nguồn thông tin, phương tiện truyền thông thương hiệu, tảng quảng cáo chí thị trường thương hiệu người tiêu dùng toàn cầu Tại Việt Nam, chiến lược dựa mạng xã hội Influencer marketing Social commerce điều cần thiết nhiều doanh nghiệp để nắm bắt thị trường Bên cạnh ưu điểm mạng xã hội có nhược điểm lo ngại người dùng riêng tư, hoạt động cá nhân họ liệu có theo dõi họ hay khơng? Thơng tin họ người nhìn thấy, chúng bị sử dụng vào mục đích gì? Thật vậy, hoạt động quảng cáo sản phẩm đến người tiêu dùng có bước chuyển biến tốt, tính thời gian dài sau để phát triển bền vững cần cải tiến Vấn đề đặt làm để người dùng vượt qua rào cản lo ngại bảo mật thông tin, an toàn cá nhân để yên tâm sử dụng facebook đồng thời đảm bảo sản phẩm dịch vụ đến gần với khách hàng tiềm Chính nhóm chúng em lựa chọn đề tài “Nhận diện giới tính thơng qua avatar mạng xã hội” Việc phân loại người dùng mạng xã hội thành lớp khác nhau, dễ dàng nhìn thấy đặc điểm chung, xu hướng biến đổi riêng nhóm khách hàng Dễ dàng thực việc đưa thông tin truyền thông đến với người tiêu dùng cách thông minh hiệu Chuẩn bị liệu 2.1 Cách thức thu nhập liệu Dữ liệu lấy từ hình ảnh đại diện cá nhân Facebook, Instagram, Tik Tok thư mục ảnh có mặt chủ tài khoản ảnh bạn bè gắn thẻ Nhóm thu thập liệu ảnh kiểm tra theo u cầu có khn mặt người để nhận dạng Với tập training 360 ảnh, tập validation 320 ảnh nhóm lọc xếp lại liệu Cụ thể nguồn data: https://drive.google.com/drive/folders/119C9LexGFDagM2J3NRKJ_6YNfQ08wTeY ?fbclid=IwAR0iYDZUmx0rIkrSMWnVWdAvgQRH6SlzUl8ysU6v6vDfqfH8fBsJsI_ bNRc 2.2 Kiểu liệu ảnh cần thu nhập Ảnh lấy trực tiếp từ facebook, Instagram, Tik Tok cá nhân người dùng khơng giới hạn kích thước Nhưng bắt buộc phải lấy khuôn mặt, số chủ sở hữu không dùng ảnh thân để làm ảnh đại diện chuyển sang thu thập ảnh mà người bạn bè gắn thẻ có xác thực gương mặt chủ ý ảnh phải rõ nét không bị mờ Từ cho cơng đoạn phân loại giới tính thuận tiện 2.3 Số lượng ảnh kiểu liệu ảnh Số lượng ảnh thu nhập cần đủ loại giới tính nam nữ, cân xứng mặt số lượng khơng có ảnh bị trùng, không lấy ảnh người nhiều Cụ thể: ● Nam 390 ảnh (trong mơ hình gắn nhãn Nam) ● Nữ 390 ảnh (trong mô hình gắn nhãn Nu) 2.4 Cách thức tổ chức liệu ảnh máy Với số lượng liệu thu nhập mục 2.3 xếp vào ba mục training, validation, test khơng có ảnh bị trùng: ● Training gồm 360 ảnh có 180 ảnh Nam 180 Nu ● Validation gồm 320 ảnh có 160 ảnh Nam 160 ảnh Nu ● Test gồm 100 ảnh có 50 anh Nam 50 ảnh Nu Giới thiệu tổng quan thuật toán CNN CNN hay Convolutional Neural Network mạng nơ-ron tích chập, mơ hình Deep Learning tiên tiến, chúng cho phép người dùng xây 19 Output: + loss acc: sai số độ xác tập Training + val_loss val_acc: sai số độ xác tập Validation => loss nhỏ acc tập Training cải thiện Tương tự, val_loss nhỏ val_acc tập Validation tốt 20 Để biểu diễn kết đạt được, nhóm có đồ thị sau: Từ đó, thấy độ xác mơ hình dao động từ 0.4 đến 1, ổn định không cao, điều làm cho nhóm phải thay đổi số thơng số thuật tốn để mơ hình xác 4.6 Tìm mơ hình tối ưu Mơ hình gốc: - Kích thước ảnh 50,50 - Hai lớp CNN: + Lớp CNN thứ có 32 lọc, lọc có kích thước 3x3 + Lớp CNN thứ hai có 64 lọc, lọc có kích thước 3x3 - Một lớp ẩn với lọc 512 - Epochs = 50 - Step_per_epouch = - Verbose = - Validation_steps = => Độ xác mơ hình ban đầu 94% có ảnh sai 50 ảnh thử ➔ Thay đổi để nâng cao chất lượng mơ hình: Có nhiều phương pháp khác để tăng độ xác cho mơ hình như: - Mở rộng liệu huấn luyện, kiểm chứng số lớp số lượng ảnh - Thực nghiệm chuẩn hóa kích thước ảnh - Bổ sung thêm lớp mạng CNN, thay đổi số lượng kích thước lọc 21 - Thay đổi tham số optimizer, đổi RMSprop sang SGD Adam - Thay đổi giá trị số vịng lặp chạy mơ hình EPOCHS, tăng số bước chạy cho EPOCHS 4.6.1 Thay đổi kích thước ảnh - Với kích thước 100x100 mơ hình đạt với độ xác 86%, dự đốn sai ảnh 50 ảnh Hiệu suất mơ hình bị giảm - Với kích thước ảnh 150x150 mơ hình đạt độ xác 82%, dự đốn sai ảnh 50 ảnh Hiệu suất mơ hình bị giảm Tóm lại, tăng kích thước ảnh lên mơ hình chạy ổn so với mơ hình gốc ban đầu Lượng ảnh dự đoán 50 ảnh kiểm tra ổn định, nhiên không thấy tăng khả xác mơ hình Nên giữ kích thước ảnh ban đầu mơ hình gốc (50x50) 4.6.2 Tăng lớp CNN mơ hình * Thêm tầng CNN3 Mơ hình 1: Lớp CNN với 32 lọc Lớp CNN với 64 lọc Lớp CNN với 128 lọc => Độ xác mơ hình 74%, có 13 ảnh nhận dạng giới tính sai 50 ảnh Giảm so với mơ hình gốc ban đầu Mơ hình 2: Lớp CNN với 32 lọc Lớp CNN với 64 lọc Lớp CNN với 64 lọc => Độ xác mơ hình 80%, có 10 ảnh nhận dạng giới tính sai 50 ảnh thử Giảm so với mơ hình ban đầu * Bổ sung thêm lớp mạng CNN3, CNN4 Lớp CNN với 32 lọc Lớp CNN với 64 lọc Lớp CNN với 128 lọc Lớp CNN với 256 lọc 22 => Độ xác mơ hình 72%, có 14 ảnh sai 50 ảnh đưa vào kiểm tra Giảm mạnh so với mơ hình gốc Như việc tăng lớp CNN không làm cho mô hình chạy hiệu Nếu tăng thêm lớp CNN làm cho mơ hình trở nên cồng kềnh, khó đưa kết nhanh chóng xác 4.6.3 Thay đổi lọc lớp CNN * Mô hình Lớp CNN với 32 lọc Lớp CNN với 32 lọc => Độ xác mơ hình 82%, 50 ảnh đưa vào để kiểm tra mơ hình nhận dạng sai ảnh Hiệu suất bị giảm so với mơ hình gốc ban đầu * Mơ hình Lớp CNN với 64 lọc Lớp CNN với 64 lọc => Độ xác mơ hình 84%, có ảnh sai 50 ảnh thử Hiệu suất bị giảm so với mơ hình gốc ban đầu * Mơ hình Lớp CNN với 64 lọc Lớp CNN với 128 lọc => Độ xác mơ hình 84%, có ảnh sai tổng số 50 ảnh đưa vào mơ hình để kiểm tra Hiệu suất mơ hình giảm * Mơ hình Lớp CNN với 128 lọc Lớp CNN với 128 lọc => Độ xác mơ hình đạt 88%, dự đốn sai ảnh tổng số 50 ảnh đưa vào mô hình để kiểm tra Hiệu suất giảm nhẹ so với mơ hình gốc ban đầu Như việc thay đổi lọc, cụ thể tăng lọc lớp CNN lên giúp cho mơ hình khơng q cồng kềnh mà chạy với hiệu suất ổn định 4.6.4 Thay đổi kích thước lọc convolutional lớp CNN * Mơ hình Lớp CNN có 32 lọc, lọc có kích thước 5x5 23 Lớp CNN có 64 lọc, lọc có kích thước 5x5 => Độ xác mơ hình đạt 62%, dự đoán sai 19 ảnh 50 ảnh đưa vào mơ hình để kiểm tra Hiệu suất mơ hình đạt lại bị giảm so với mơ hình ban đầu * Mơ hình Lớp CNN có 32 lọc, lọc có kích thước 7x7 Lớp CNN có 64 lọc, lọc có kích thước 7x7 => Độ xác mơ hình đạt 82%, dự đốn sai ảnh 50 đưa vào mơ hình Hiệu suất mơ hình giảm Như việc thay đổi kích thước lọc khơng làm cho mơ hình hoạt động hiệu Nên giữ nguyên kích thước lọc ban đầu 3x3 4.6.5 Tăng thêm lớp ẩn * Tăng thêm lớp ẩn Mơ hình 1: Lớp ẩn có 256 lọc Lớp ẩn có 512 lọc => Độ xác mơ hình đạt 88%, dự đoán sai 50 ảnh đưa vào kiểm tra Hiệu suất mơ hình giảm Mơ hình 2: Lớp ẩn có 512 lọc Lớp ẩn có 512 lọc => Độ xác 70%, dự đoán sai 15 ảnh tổng số 50 ảnh kiểm tra Hiệu suất mơ hình giảm Mơ hình 3: Lớp ẩn có 512 lọc Lớp ẩn có 1024 lọc => Độ xác 66%, dự đoán sai 17 tổng 50 ảnh kiểm tra Hiệu suất mơ hình giảm mạnh * Tăng thêm hai lớp ẩn Lớp ẩn có 512 lọc Lớp ẩn có 512 lọc 24 Lớp ẩn có 512 lọc => Độ xác 64%, dự đoán sai 18 tổng số 50 ảnh kiểm tra Hiệu suất mơ hình bị giảm Như tăng thêm lớp ẩn khơng làm cho mơ hình hoạt động hiệu hơn, nên giữ nguyên lớp ẩn ban đầu với 512 lọc 4.6.6 Thay đổi lọc lớp ẩn - Lớp ẩn có 256 lọc Độ xác mơ hình 72%, dự đốn sai 14 ảnh 50 ảnh Hiệu suất mơ hình giảm - Lớp ẩn có 1024 lọc Độ xác mơ hình 82%, dự đoán sai 50 ảnh Hiệu suất mơ hình giảm - Lớp ẩn có 128 lọc Độ xác 64%, dự đốn sai 18 50 ảnh Hiệu suất mơ hình giảm Như lọc lớp ẩn 1024 mơ hình chạy ổn định với hiệu suất giống mơ hình gốc ban đầu, có giảm khơng đáng kể Nếu giảm lọc lớp ẩn hiệu suất mơ hình bắt đầu giảm mạnh Vì lọc lớp ẩn giữ ngun mơ hình gốc khơng thay đổi 4.6.7 Thay đổi tham số optimizer * Thay đổi RMSprop sang SGD Độ xác 90%, dự đốn sai tổng số 50 ảnh kiểm tra Hiệu suất mơ hình bị giảm * Thay đổi RMSprop sang Adam Độ xác 84%, dự đốn sai tổng số 50 ảnh kiểm tra Hiệu suất mơ hình bị giảm Như thay đổi tham số optimizer, mơ hình chạy ổn định so với hiệu suất mơ hình gốc, có giảm khơng đáng kể Vì tham số optimizer khơng thay đổi, giữ ngun mơ hình gốc ban đầu Sau lần chạy thử thay đổi thông số trên, nhận thấy độ xác mơ hình khơng nâng cao, nên nhóm định sử dụng thơng số mơ hình gốc mơ hình tối ưu cuối Mơ hình tối ưu cuối cùng: - Kích thước ảnh đầu vào 50x50 25 - Hai lớp CNN: + Lớp CNN thứ có 32 lọc, lọc có kích thước 3x3 + Lớp CNN thứ hai có 64 lọc, lọc có kích thước 3x3 - Một lớp ẩn 512 lọc - Epochs = 50 - Step_per_epouch = - Verbose = - Validation_steps = 4.7 Sử dụng mơ hình Khai báo thư viện, sau tải hình ảnh muốn dự đoán: + from google.colab import files; from keras.preprocessing import image; %matplotlib inline: Dùng để đưa liệu ảnh vào + import matplotlib.pyplot as plt; import matplotlib.image as mpimg: Dùng để khai báo thư viện matplotlib.pyplot, matplotlib.image + uploaded=files.upload(): Dùng để tạo chỗ upload ảnh cần dự đoán Vòng lặp For: + For python vòng lặp giúp lặp lại xử lý chương trình với số lần cụ thể Những phần nằm vòng lặp for cần lùi vào đầu dòng + for fn in uploaded.keys(): có fn biến, uploaded.keys() đối tượng có nhiều phần tử + path='/content/'+fn: đường dẫn ảnh cần dự đoán + plt.imshow(mpimg.imread(path)): dùng để in ảnh đọc 26 + img=image.load_img(path,target_size=(50,50)): tải hình ảnh đưa kích thước hình ảnh thành (50,50) + img_to_array(): dùng để thêm kênh cho RGB cho hình ảnh màu xám + expand_dim(): sử dụng để thêm số lượng hình ảnh + np.vstack: nối mảng theo chiều dọc + batch_size: số lượng mẫu liệu lần huấn luyện Chúng ta khơng thể đưa hết tồn liệu vào huấn luyện epoch, cần phải chia tập liệu thành phần (number of batch), phần có kích thước batch_size (tập liệu có 100, batch_size 10) + y_predict = model.predict(images,batch_size=10): Mơ hình dự đốn thơng qua ảnh với batch size=10 tức số lượng ảnh lần lặp 10 + print(y_predict); print('Giá trị dự đoán:',Label[np.argmax(y_predict)]): In giá trị dự đốn Thử nghiệm mơ hình: Sau nhấn chạy đoạn code trên, phía đoạn mã code xuất kết yêu cầu chọn hình ảnh để phân loại, kích chọn hộp thoại “Choose files” => xuất hộp thoại “Open” => chọn ảnh cần phân loại đợi kết 27 Kết luận 5.1 Nhận định Kết mơ hình chạy được: Có hai giá trị mà máy đưa tương ứng với hai giá trị mong đợi: 1.0 tương ứng với Nam 0.1 tương ứng với Nu Đây gán nhãn code ban đầu tạo thành, sau trình cho máy nhận dạng cho kết nữ giá trị tương ứng với có, cịn giá trị thứ hai số tương ứng với khơng có giá trị Tương tự máy nhận dạng nam giá trị thứ tương ứng với khơng có giá trị giá trị thứ hai Tuy nhiên khơng phải lúc máy học đưa giá trị đẹp 1.0 hay 0.1, dãy số dài thập phân: 28 Khi xảy trường hợp kết đưa Nam Nu sai, lẽ ta nhìn thấy giá trị đẹp 1.0 khơng hồn tồn Việc đưa giá trị thập phân định kết việc hai giá trị giá trị cao Ví dụ (2.044607e - 16 1.000000e + 00) 2.044607e - 16 = -10.4422 1.00000000e + 00 = 2.7182 Như giá trị thứ hai cao giá trị thứ nhất, nghĩa khả người nữ cao nam, nên máy đưa kết nữ Kết thực nghiệm: Nam Nu Số ảnh thực nghiệm 50 50 Dự đoán 42 43 Dự đoán sai Tỷ lệ dự đốn xác 84% 86% Mơ hình đơn giản, dễ hiểu, dễ cài đặt thời gian thực không lâu, không phức tạp Mơ hình có khả nhận diện giới tính nam nữ với độ xác tương đối cao, cụ thể nam độ xác 84%, nữ 86% Mơ hình có độ xác cao nhiên số hạn chế mà nhóm chưa khắc phục góc chụp ảnh mặt người góc nghiêng, số ảnh cịn mờ hay có ảnh nam tóc để dài, trang điểm hay đeo kính khiến nhận dạng bị sai Có thể số lượng liệu ảnh nhóm thu thập cịn nên khó tránh khỏi sai sót, số thơng số kích thước ảnh, vịng lặp… cịn chưa tối ưu Bên cạnh đó, giới tính dừng lại nữ nam, cịn có giới tính thứ ba nhiều nước cơng nhận, họ có nét khn mặt số đặc điểm cịn có chút mâu thuẫn nên máy khó nhận diện xác Để có mơ hình hồn chỉnh hơn, nhóm chúng em tự nhận thấy cần tìm kiếm thêm nguồn liệu xác, đa dạng hơn, điều chỉnh tham số xử lí liệu để tìm mơ hình tối ưu cho độ xác cao 29 5.2 Ý nghĩa thực tế Hành vi, thói quen mua sắm người tiêu dùng thay đổi theo giới tính khách hàng Ví dụ, nam giới thường mua sắm mặt hàng liên quan đến thể dục thể thao, nữ giới độ tuổi lại quan tâm đến sản phẩm chăm sóc sắc đẹp nhiều Việc phân loại giới tính người dùng mạng xã hội nói chung facebook nói riêng giúp cho doanh nghiệp có nhìn thực tế xác nhóm người dùng Từ đó, công việc phân loại tập khách hàng mục tiêu, phù hợp mà doanh nghiệp hướng tới trở nên vơ đơn giản Bên cạnh đó, doanh nghiệp dễ dàng theo dõi hoạt động, sản phẩm mà khách hàng yêu thích, đề xuất quảng cáo cách thơng minh có chọn lọc, tăng hiệu kinh doanh Hơn nữa, với thông tin mà thu thập được, doanh nghiệp cung cấp số liệu hữu ích cho số cơng ty nghiên cứu thị trường để từ dễ dàng ứng dụng đề xuất sản phẩm cho khách hàng Ngồi ý nghĩa phân loại giới tính khách hàng để doanh nghiệp có nhìn thực tế hơn, đề xuất sản phẩm, dịch vụ cho người, đối tượng, tăng hài lòng khách hàng chúng em phân tích mơ hình cịn định hướng phát triển vào thực tế cho nhiều lĩnh vực khác Ví dụ nhận diện giới tính kiểm tra giới tính mà người dùng khai báo hồ sơ ứng dụng hẹn hò đề xuất ghép cặp dựa ảnh đại diện Việc sử dụng công nghệ AI để phân loại giới tính khách hàng làm tăng khả giám sát quản lý mạnh, từ giúp cho khối lượng công việc bớt cồng kềnh hơn, đặc biệt với cơng ty có quy mơ nhỏ, số lượng nhân viên khơng nhiều Mơ hình nhận diện giới tính tích hợp, phát triển lên với nhận diện hình ảnh khách hàng để ứng dụng vào lĩnh vực khác đời sống Ví dụ ngành ngân hàng, phương pháp giúp khách hàng mở tài khoản online cách sử dụng ảnh selfie đối chiếu với ảnh giấy tờ tùy thân để xác minh danh tính khách hàng Như vậy, khách hàng nhanh chóng mở tài khoản nơi đâu với thiết bị di động kết nối mạng internet, cắt giảm hồn tồn quy trình xác minh giấy tờ truyền thống văn phòng giao dịch, mang lại trải nghiệm tích cực cho khách hàng Đồng thời, khối lượng công việc giao dịch viên ngân 30 hàng giảm tải, giúp tiết kiệm thời gian, tối ưu nguồn nhân lực để thực nghiệp vụ quan trọng Ở góc độ lớn hơn, dân số không ngừng tăng, để thống kê dân số, phân loại giới tính người thời gian Chính vậy, sử dụng AI để cải thiện vấn đề hợp lý, đơn giản mà dễ thực Trên hệ thống liệu quốc gia, ảnh chứng minh thư người dân ghi lại có tác dụng để xác minh giới tính, đặc điểm nhận dạng, quê quán, quốc tịch… Dữ liệu hình ảnh cơng dân quan nhà nước lưu trữ, thống kê, quản lý sử dụng nhằm mục đích xác định danh tính trường hợp cần thiết, gia tăng tính bảo mật thơng tin cá nhân Điều giúp quan quản lý hoạt động suất, có hiệu hơn, tận dụng nguồn thời gian nhân lực để thực nhiệm vụ khác Đây ứng dụng AI nhận diện hình ảnh Thuật tốn đơn giản, dễ hiểu, dễ cài đặt sử dụng không phức tạp nhiên, số lượng liệu ảnh lớn nên dẫn tới thời gian thực lâu Theo chúng em, mô hình thân thiện, tiện ích người dùng, giúp tăng hiệu hoạt động kinh doanh cho doanh nghiệp Mơ hình nhận diện khơng giúp nhận diện giới tính mà cịn có tính ứng dụng vơ rộng rãi mạnh mẽ giúp nhận diện cảm xúc để đánh giá mức độ hài lòng khách hàng, nhận diện độ tuổi để chạy quảng cáo phù hợp, nhận diện sản phẩm siêu thị… từ đem lại hiệu tích cực đổi phát triển kinh tế - xã hội DANH MỤC TÀI LIỆU THAM KHẢO Tài liệu nước Greerand, J D., & Yan, Y (2011) Newspapers connect with readers through multiple digital tools Newspaper Research Journal Lukka, V., & James, P T (2014) Attitudes toward Facebook advertising Journal of management and Marketing Research Rohani, V A., & Hock, O S (2010) On social network Web sites: Definition, features, architectures and analysis tools Journal of Advances in Computer Research Tài liệu tiếng Việt Anh Trần, “Giới thiệu chung Facebook”, Kienthucvui.vn, https://kienthucvui.vn/facebook-la-gi-tim-hieu-ve-mang-xa-hoi-facebook-183/ Hồng Phương (2021), “Trí tuệ nhân tạo dùng để phân tích giới tính qua khn mặt”, Việt Nam mới, https://vietnammoi.vn/tri-tue-nhan-tao-duoc-dung-de-phan-tichgioi-tinh-qua-khuon-mat-51617.htm “Cách đặt batch_size, step_per epoch bước xác thực”, qastack https://qastack.vn/datascience/29719/how-to-set-batch-size-steps-per-epoch-andvalidation-steps Định nghĩa giải thích ý nghĩa verbose, gocnhintangphat https://gocnhintangphat.com/verbose-la-gi/ Giới thiệu matplotlib, viblo https://viblo.asia/p/gioi-thieu-ve-matplotlib-mot-thu-vien-rat-huu-ich-cua-pythondung-de-ve-do-thi-yMnKMN6gZ7P Những cần thiết lập step_per_epoch, stackexhange https://datascience.stackexchange.com/questions/47405/what-to-set-in-steps-perepoch-in-keras-fit-generator 10 Mạng nơ ron tích chập CNN https://drive.google.com/file/d/1SfvDRUpkeyrSeDCrv6mt0n-cYrN2VIdO/view 11 Thuật toán CNN - Convolututional neural network, topdev.vn https://topdev.vn/blog/thuat-toan-cnn-convolutional-neural-network/ More from: Phân tích tài doanh… FIN41A Học viện Ngân hàng 18 documents Go to course Make sentences - Anh Phân tích tài doanh… None Nhóm Tài Tiền 23 tệ - shsajak Phân tích tài doanh… None V-BTL mơn pt2 15 mmm Phân tích tài doanh… None 36.PLT 09A 08 Triết học Phân tích tài doanh… Recommended for you None 28 Bài tập tập triết HVNH, triết học mác… Triết học Mác Lênin 86% (7) E đảo ngược u - Phát âm ielts Triết học Mác Lênin 100% (1) Correctional Administration Criminology 96% (113) English - huhu 10 Led hiển thị 100% (3)

Ngày đăng: 03/01/2024, 13:43

w